强化学习笔记4:无模型预测 model-free prediction RL的一个重要突破就是不基于模型的控制,在控制之前,需要先用model-free control对策略进行评估 2020-07-15 强化学习笔记 强化学习 RL 无模型预测 model-free prediction 强化学习笔记3:动态规划 planning by dynamic programming(DP) 规划是基于模型的搜索,学习是基于数据的总结。动态规划DP,用迭代的方法将价值函数、策略收敛到最优 2020-07-10 强化学习笔记 强化学习 RL 动态规划 dynamic programming MBSE 基于模型的系统工程 改变传统设计的繁杂工作流程,用系统的思想、数字化的语言和工具,将项目周期加快,加快,再加快 2020-07-08 笔记 系统工程 MBSE 强化学习笔记2:马尔科夫决策过程Markov decision process(MDP) 将游戏过程、动力学过程抽象为马尔科夫过程MP,便于引入到RL进行研究 2020-07-05 强化学习笔记 强化学习 RL 马尔科夫决策过程 MDP 强化学习笔记1:基本概念 从简单概念入手,介绍强化学习Reinforcement learning的基本结构 2020-07-01 强化学习笔记 RL 强化学习 机器学习-Coursera笔记 Coursera网站Andrew Ng的ML课程笔记 2020-06-28 机器学习笔记 机器学习 ML Coursera RNN 序列模型 sequence model RNN序列模型,主要用于自然语言处理NLP等环境,引入attention机制,让网络的input在随时间步进行中,较远的运算之得以保留 2020-06-25 机器学习笔记 序列模型 sequence model 循环神经网络 RNN 科学写作 追求效率至上,知道怎么做,比早点出发更重要 2020-05-03 笔记 科学写作 Paper Mac必备软件推荐,让你效率起飞🚀 Mac2021装机必备,让你的效率提高20倍,系统、多媒体、写作都在这儿了 2020-05-01 工具 工具 trick App 控制理论笔记 经典控制理论笔记,线性系统控制理论笔记 2020-04-05 控制理论笔记 高级控制理论 经典控制理论 Mac设置 记录备忘mac系统、软件的设置 2020-04-01 设置备忘 App 系统 Mac 黑苹果 Latex设置 备忘Latex的设置(持续更新) 2020-03-18 设置备忘 Snippets Latex