Tag: others
All the articles with the tag "others".
-
强化学习笔记6:值函数估计Value function Approximation
离散空间的RL问题可以构建value table进行查表解决,对于连续空间的问题,可以引入值函数估计器,解决了查表运算量大的问题
-
深度学习22张精炼图笔记总结
记录了深度学习课程的知识与亮点,不仅仅适合初学者了解深度学习,还适合机器学习从业者和研究者复习基本概念。
-
Keras & Tensorflow 笔记
Keras是一个高层神经网络API,能够把你的idea迅速转换为结果
-
强化学习笔记5:无模型控制 Model-free control
完成了不基于模型的策略评估之后,可以采取$psilon$-greedy等方法进行动作选取,根据状态信息进行动作选取并执行,就实现了不基于模型的控制
-
深度学习-Coursera笔记
深度学习是用深度神经网络的方法,将机器学习加以拓展,其优势是可以实现超复杂非线性函数的映射
-
控制理论笔记-2
BiliBili_Dr_can 课程笔记
-
卷积神经网络CNN(convolutional)
卷积神经网络,一般用于Computer vision等领域,典型应用有物体检测、人脸识别等
-
强化学习笔记4:无模型预测 model-free prediction
RL的一个重要突破就是不基于模型的控制,在控制之前,需要先用model-free control对策略进行评估
-
强化学习笔记3:动态规划 planning by dynamic programming(DP)
规划是基于模型的搜索,学习是基于数据的总结。动态规划DP,用迭代的方法将价值函数、策略收敛到最优
-
MBSE 基于模型的系统工程
改变传统设计的繁杂工作流程,用系统的思想、数字化的语言和工具,将项目周期加快,加快,再加快