Algorithm

二叉树复习


放完假刷leetcode发现二叉树遍历都忘记了,复习记录一下。

Evolution Strategy

介绍

前面学习了遗传算法,最近又看到在强化学习中的应用:进化算法玩Atari,今天看一下可以用在神经网络中的进化策略(Evolution Strategy,ES)。

动态规划


前面的遗传算法使用背包问题当做例子,然而背包问题通常使用动态规划的方式来解,这里看一下动态规划怎么解决问题。

Genetic Algorithm


看Uber的deep-neuroevolution看不懂,先了解一下基本的遗传算法。

遗传算法的本质是一种并行,高效,全局搜索的方法

遗传算法将问题的根据实际情况进行编码并将其视为单独的个体,使用编码的交换,突变来产生下一代种群,每次迭代使用适当的评估函数评价个体(解)的适应度,循环迭代取得相对最优的解。

Q-learning


Qlearning是一种基于价值的强化学习方法 下面是个简单的例子来自周莫烦