强化学习:控制工程师帮你醍醐灌顶 youtube上官方matlab下深度学习RL课程笔记,从工程师的角度宏观上概述了RL问题的所有关键点和注意点 2020-09-08 笔记 强化学习 RL Matlab
RL实践2——RL环境gym搭建 算法研究者,可以快速利用多种不同的环境验证迭代自己的算法有效性。算法应用,可以效仿gym中的接口,搭建自己的环境。 2020-09-03 强化学习实践 强化学习 RL gym
强化学习笔记9:探索和利用 exploration and exploitation 利用让Agent更稳定,探索让Agent上限更高,二者不可得兼,平衡一下吧 2020-08-23 强化学习笔记 强化学习 RL 探索 exploration 利用 exploitation
强化学习笔记7:策略梯度 Policy Gradient 策略梯度法,可以实现不基于价值函数的动作选取,在训练过程中稳定性更优 2020-08-11 强化学习笔记 强化学习 RL 策略梯度 Policy gradient
为什么数值仿真里要用RK4(龙格库塔法) 当然是因为他仿真精度高啊,为啥,进来看看吧小跳最近在搭建一个数值仿真环境,由于需要用到python里面的一些库,所以不得不把simulink的模型搬过来,我们都知道在simulink里,仿真的时候设置仿真步长和微分方程求解器是必要的步骤。但是为什么要设置这个小跳却早已忘记了。 2020-08-05 笔记 RK4 数值仿真
强化学习笔记6:值函数估计Value function Approximation 离散空间的RL问题可以构建value table进行查表解决,对于连续空间的问题,可以引入值函数估计器,解决了查表运算量大的问题 2020-08-05 强化学习笔记 强化学习 RL 值函数估计 value function approximation