推荐文章
笔记

为什么数值仿真里要用RK4(龙格库塔法)

当然是因为他仿真精度高啊,为啥,进来看看吧小跳最近在搭建一个数值仿真环境,由于需要用到python里面的一些库,所以不得不把simulink的模型搬过来,我们都知道在simulink里,仿真的时候设置仿真步长和微分方程求解器是必要的步骤。但是为什么要设置这个小跳却早已忘记了。

阅读更多
工具

免费图床搭建:Github+Picgo+jsDelivr

免费图床,稳定可靠,结合CDN加速,棒了

阅读更多
工具

ios黄页:可算让iPhone好用了点儿

ios黄页,让你用iPhone打电话的时候快人一步

阅读更多
工具

Mac必备软件推荐,让你效率起飞🚀

Mac2021装机必备,让你的效率提高20倍,系统、多媒体、写作都在这儿了

阅读更多
Python-Latex主题分享 Python-Latex主题分享
人生苦短,我用python,Life is short, you need Python——Bruce Eckel
2021-09-24
mac开启HiDPI mac开启HiDPI
让你的显示器支持苹果的HiDPI黑科技,用降低分辨率的代价获得更好的显示效果「手动狗头」,对你的眼睛好一点
2021-01-07
Getting Started with gym Getting Started with gym
OpenAI gym 的入门教程,参考自官网的gym手册
强化学习:控制工程师帮你醍醐灌顶 强化学习:控制工程师帮你醍醐灌顶
youtube上官方matlab下深度学习RL课程笔记,从工程师的角度宏观上概述了RL问题的所有关键点和注意点
2020-09-08
RL实践3——为Agent添加Policy、记忆功能 RL实践3——为Agent添加Policy、记忆功能
利用SARSA(0)的学习方法,帮助agent学习到价值函数(表),进而选取动作。
RL实践2——RL环境gym搭建 RL实践2——RL环境gym搭建
算法研究者,可以快速利用多种不同的环境验证迭代自己的算法有效性。算法应用,可以效仿gym中的接口,搭建自己的环境。
RL实践1——动态规划值迭代 RL实践1——动态规划值迭代
实现用 动态规划 值迭代 的方法,求解格子世界中的随机策略价值函数
强化学习笔记9:探索和利用 exploration and exploitation 强化学习笔记9:探索和利用 exploration and exploitation
利用让Agent更稳定,探索让Agent上限更高,二者不可得兼,平衡一下吧
解锁播放器的隐藏功能👀用过的都说好😎 解锁播放器的隐藏功能👀用过的都说好😎
教你用浏览器看电视,全球的频道都可以access,跳广告的什么的也都在这儿了
2020-08-21
免费图床搭建:Github+Picgo+jsDelivr 免费图床搭建:Github+Picgo+jsDelivr
免费图床,稳定可靠,结合CDN加速,棒了
2020-08-19
强化学习笔记8:整合学习和规划 强化学习笔记8:整合学习和规划
规划是基于模型的搜索,学习是基于数据的总结,二者结合,1+1>2
1 / 4