David Silver 深度强化学习课程「中文字幕」

David Silver 深度强化学习课程「中文字幕」 扫二维码继续学习 二维码时效为半小时

(2 评论)

免费

课程介绍

David Silver 博士是 AlphaGo 的最主要研发人员。众所周知,AlphaGo 是第一个战胜人类顶级围棋高手的计算机围棋程序。AlphaGo 底层核心技术包括深度学习(deep learning)、强化学习(reinforcement learning),和蒙特卡洛搜索树(Monte Carlo tree search)。 

 

在这门强化学习的课程中,Silver 博士从简介、马尔科夫决策过程(Markov Decision Processes)、免模型预测(Model-free Prediction)、免模型控制(Model-free Control)、值函数近似(Value Function Approximation)、策略梯度算法(Policy Gradient)、集成学习和计划(Integrating Learning and Planning)、探索与利用(Exploration and Exploitation)、游戏等方面深入浅出地介绍强化学习。课程中也涉及最近的热点:深度强化学习

 

请用微信扫描下方二维码添加小助手,申请加入课程交流群(Paperweekly&AI100强化学习群)哦!

 

 

授课教师

AI100管理员