小不点搜索 登录

2. 强化学习基础之马尔可夫决策过程

[视频作者] CV-xueba
[视频时长] 136:40
#考试,大学,线上课堂,课程,教育,公开课,编程,讲座,教学视频,教程#
[视频类型] 校园学习
本课程主要介绍强化学习的基础知识,其目标是帮助同学们快速、顺利地进入强化学习及其应用领域的研究工作。课程主要内容包含有限马尔可夫决策过程,动态规划,无模型预测与控制(SASA,Q-Learning),价值函数逼近(DQN),策略梯度方法(REINFORCE),执行者/评论者方法(AC,TRPO,PPO),连续动作空间的确定性策略(DDPG)。 这是本门课程的第二讲。
2. 强化学习基础之马尔可夫决策过程
以上内容由小不点搜索引擎从网站www.bilibili.com自动化索引镜像而来,不代表网站的即时内容,也无法确保其有效性;仅限个人学习使用,禁止商用。如有任何异议,请使用举报删除
影音视频访问链接
以下链接为影音视频“2. 强化学习基础之马尔可夫决策过程”在线访问地址,点击链接就可以访问查看啦