本课程是杜克大学普拉特工程学院人工智能产品管理专业的第二门课程,重点是管理机器学习项目的实践方面。 课程将介绍机器学习项目的关键步骤,从如何确定机器学习的良好机会,到数据收集、模型构建、部署以及生产系统的监控和维护。 学员将学习数据科学流程、如何应用该流程组织 ML 工作,以及设计 ML 系统时的关键考虑因素和决策。 课程结束后,您应该能够: 1) 识别应用 ML 为用户解决问题的机会 2) 应用数据科学流程组织 ML 项目 3) 评估 ML 系统设计中的关键技术决策 4) 使用最佳实践领导 ML 项目从构思到生产的整个过程
在本模块中,我们将讨论如何识别值得解决的问题,如何确定 ML 是否适合作为解决方案的一部分,以及如何验证解决方案概念。 我们还将了解为什么启发式方法在建模项目中很有用,以及相对于启发式方法,ML 的优缺点。
涵盖的内容
9个视频5篇阅读材料1个作业2个讨论话题
显示有关单元内容的信息
9个视频•总计42分钟
专业概述•4分钟
讲师介绍•1分钟
课程概览•5分钟
导言和目标•1分钟
寻找机会•8分钟
验证产品创意•5分钟
产品中使用 ML 的好处•8分钟
ML 与启发式•6分钟
单元总结•2分钟
5篇阅读材料•总计85分钟
关于课程•5分钟
重要提醒•10分钟
报告课程问题•10分钟
下载模块幻灯片•30分钟
为多边形测量确定好问题•30分钟
1个作业•总计30分钟
第 1 单元测验•30分钟
2个讨论话题•总计30分钟
验证产品创意(可选)•10分钟
启发式方法•20分钟
组织 ML 项目
第 2 单元•小时 后完成
单元详情
在本模块中,我们将重点介绍 CRISP-DM 数据科学流程,以及如何将其用于组织 ML 项目。 首先,我们将了解 ML 项目相对于普通软件项目的独特之处,然后讨论管理 ML 项目固有风险的方法。 我们还将介绍 ML 项目团队中的关键角色以及如何组织工作。
涵盖的内容
8个视频2篇阅读材料1个作业1个讨论话题
显示有关单元内容的信息
8个视频•总计65分钟
导言和目标•2分钟
ML 项目与软件项目•7分钟
CRISP-DM 数据科学流程•13分钟
CRISP-DM 案例研究•18分钟
团队组织•10分钟
组织项目•6分钟
衡量绩效•7分钟
单元总结•1分钟
2篇阅读材料•总计60分钟
下载模块幻灯片•30分钟
为什么 ML 项目难以管理?•30分钟
1个作业•总计30分钟
第二单元测验•30分钟
1个讨论话题•总计20分钟
成果和产出指标(可选)•20分钟
数据考虑因素
第 3 单元•小时 后完成
单元详情
在本模块中,我们将探讨在 ML 项目中出现的与数据相关的关键问题。 数据是机器学习成功的基础,收集数量充足、质量上乘、属性正确的数据是项目成功的关键。 我们将讨论在获取数据、清理数据以及开发和选择建模中使用的特征集时需要考虑的关键因素。 本模块最后将讨论确保数据管道可重现性的最佳实践。
涵盖的内容
8个视频2篇阅读材料1个作业1个讨论话题
显示有关单元内容的信息
8个视频•总计58分钟
导言和目标•2分钟
数据需求•8分钟
数据收集•12分钟
数据管理与访问•6分钟
数据清理•9分钟
为建模准备数据•10分钟
可重复性和版本管理•9分钟
单元总结•2分钟
2篇阅读材料•总计60分钟
下载模块幻灯片•30分钟
我们如何改进 Spotify 数据科学家的数据发现工作•30分钟
1个作业•总计30分钟
第 3 单元测验•30分钟
1个讨论话题•总计20分钟
收集数据(可选)•20分钟
ML 系统设计与技术选择
第 4 单元•小时 后完成
单元详情
在本模块中,我们将讨论设计 ML 系统时需要做出的关键决策,如云与边缘、在线与批量,并比较每种类型系统的优势。 然后,我们将讨论 ML 项目中的主要技术决策,并介绍用于构建 ML 模型的常用工具和技术。
涵盖的内容
8个视频2篇阅读材料1个作业1个讨论话题
显示有关单元内容的信息
8个视频•总计51分钟
导言和目标•1分钟
ML 系统设计考虑因素•7分钟
云与边缘•11分钟
在线学习与推理•9分钟
大数据的 ML•4分钟
选择 ML 技术•5分钟
常用 ML 工具•13分钟
单元总结•2分钟
2篇阅读材料•总计60分钟
下载模块幻灯片•30分钟
为什么 Jupyter 是数据科学的首选计算笔记本?•30分钟
1个作业•总计30分钟
第 4 单元测验•30分钟
1个讨论话题•总计20分钟
在线预测(可选)•20分钟
模型生命周期管理
第 5 单元•小时 后完成
单元详情
课程的最后一个模块侧重于识别和缓解 ML 模型投入生产后遇到的关键问题。我们将讨论如何建立强大的 ML 系统监控能力,并定义模型维护计划,以保持生产模型的高性能。 最后,我们将讨论版本管理在 ML 系统中的重要性,以促进部署后的持续快速迭代。
I like this course; it is very informative. I learned a lot of useful concepts, and I reinforced much of what I knew. I recommend this course, even if is just for fun.
D
DM
5·
已于 May 4, 2026审阅
Clear understanding of the different problems on how to approach ML opportunities
L
LR
5·
已于 Jun 29, 2023审阅
I appreciate the use cases that were shared throughout the course. It helped tremendously.