在这最后一门课程中,您将综合运用课程 1、2 和 3 中的知识,针对一个问题实施完整的 RL 解决方案。在这个毕业设计中,您将了解问题的提出、算法的选择、参数的选择和表示法的设计等各个环节是如何组合成一个完整的解决方案的,以及在现实世界中部署 RL 时如何做出适当的选择。本项目将要求您同时实现激发问题的环境和具有神经网络函数逼近功能的控制代理。此外,您还将对学习系统进行科学研究,以培养评估 RL 代理稳健性的能力。要在现实世界中使用 RL,关键在于:(a) 将问题适当地形式化为 MDP;(b) 选择适当的算法;(c) 确定实施过程中哪些选择会对性能产生重大影响;(d) 验证算法的预期行为。对于打算使用 RL 解决实际问题的人来说,这门顶点课程非常有价值。 要成功完成这门课程,您需要完成本专业的课程 1、2 和 3 或同等课程。 在本课程结束时,您将能够
了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有6个模块
欢迎来到强化学习专业的最后一门顶点课程
涵盖的内容
2个视频2篇阅读材料1个讨论话题
本周,你们将阅读一个问题的描述,并将其转化为一个 MDP。您将完成该环境的骨架代码,从而获得一个完整的 MDP,用于本毕业设计项目。
涵盖的内容
4个视频1个编程作业
本周,你们将从三种算法中进行选择,学习环境政策。你们将思考并讨论每种算法是否适合这种环境。
涵盖的内容
7个视频1个作业
本周,您将确定影响代理绩效的关键参数。这样做的目的是了解可选参数的范围,以便日后选择要深入研究的代理参数。
涵盖的内容
4个视频1个作业
本周,您将使用 Expected Sarsa 或 Q-learning 与 RMSProp 和神经网络实现代理。您还将验证代理的正确性。
涵盖的内容
6个视频1个编程作业
本周,您将为您的代理确定一个要研究的参数。选定要研究的参数后,我们将为您提供其他参数的取值范围和具体数值。您将编写一个脚本,在一组参数上运行您的代理和环境,以确定这些参数的性能。您将深入了解参数对代理性能的影响。此外,您还可以将所学到的代理可视化。您的参数研究将包括一个数组值,我们将检查其正确性。
涵盖的内容
6个视频1个编程作业
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
位教师


从 机器学习 浏览更多内容
- 状态:免费试用
University of Alberta
- 状态:免费试用
- 状态:免费试用
University of Alberta
- 状态:免费试用
人们为什么选择 Coursera 来帮助自己实现职业发展




学生评论
648 条评论
- 5 stars
78.08%
- 4 stars
15.74%
- 3 stars
5.09%
- 2 stars
0.61%
- 1 star
0.46%
显示 3/648 个
已于 Aug 2, 2020审阅
One of the most amazing set of courses that I have ever been through. This neither makes the stuff look difficult nor does it compromise on quality, absolutely the best.
已于 Jul 10, 2020审阅
Strongly recommend this course to others. The project could be a little more challenging though. Thanks, Martha, Adam, and RAs, for your good teaching!
已于 Jan 12, 2022审阅
It may have been useful to provide less guidance to the students to make sure they develop the required skills.
常见问题
要获取课程资料、作业和证书,您需要在注册课程时购买证书体验。 您可以尝试免费试听,或申请资助。课程可能提供 "完整课程,无证书"。通过该选项,您可以查看所有课程资料,提交必要的评估,并获得最终成绩。这也意味着您无法购买证书体验。
注册课程后,您就可以访问专项课程中的所有课程,完成作业后还可以获得证书。您的电子证书将添加到您的 "成就 "页面--在那里,您可以打印证书或将其添加到您的 LinkedIn 个人资料中。
是的。在特定的学习课程中,如果您付不起注册费,可以申请助学金或奖学金。如果您选择的学习课程有助学金或奖学金,您可以在说明页面找到申请链接。
更多问题
提供助学金,