University of Colorado Boulder
机器学习入门:监督学习
University of Colorado Boulder

机器学习入门:监督学习

Geena Kim

位教师:Geena Kim

19,238 人已注册

包含在 Coursera Plus

深入了解一个主题并学习基础知识。
3.3

(82 条评论)

中级 等级

推荐体验

灵活的计划
4 周 在 10 小时 一周
自行安排学习进度
89%
大多数学生喜欢此课程
深入了解一个主题并学习基础知识。
3.3

(82 条评论)

中级 等级

推荐体验

灵活的计划
4 周 在 10 小时 一周
自行安排学习进度
89%
大多数学生喜欢此课程

您将学到什么

  • 使用现代机器学习工具和 python 库。

  • 比较逻辑回归的优缺点。

  • 解释如何处理线性不可分数据。

  • 解释什么是决策树及其如何分割节点。

要了解的详细信息

可分享的证书

添加到您的领英档案

作业

6 个测验,3 项作业

授课语言:英语(English)

了解顶级公司的员工如何掌握热门技能

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

积累特定领域的专业知识

本课程是 机器学习:理论与 Python 上机实践 专项课程 专项课程的一部分
在注册此课程时,您还会同时注册此专项课程。
  • 向行业专家学习新概念
  • 获得对主题或工具的基础理解
  • 通过实践项目培养工作相关技能
  • 获得可共享的职业证书

该课程共有6个模块

本周,我们将打好监督机器学习的基础。数据清理和 EDA 似乎并不光彩,但这一过程对于指导您的实际数据项目至关重要。 您很可能以前听说过线性回归。在机器学习的热潮下,我们从这样一种标准的统计技术入手似乎有些出人意料。在《如何不犯错:数学思维的力量》一书中,乔丹-艾伦伯格将线性回归称为 "统计技术之于社会科学,就像螺丝刀之于家庭维修。无论什么任务,你都会用到它"(51)。线性回归是解决连续结果问题的绝佳起点。希望本周的学习能让你体会到,用这样一个简单的模型就能完成很多事情。

涵盖的内容

5个视频15篇阅读材料1个测验3个作业1个编程作业1次同伴评审2个讨论话题

本周我们将在上周的基础上,学习更复杂的线性回归模型。本周之后,您将能够创建包含多个解释变量和分类变量的线性模型。从数学和语法上讲,多元线性回归模型是我们上周学习的较简单线性回归模型的自然延伸。本周我们必须牢记的一个区别是,我们的数据空间现在是三维的,而不是二维的。在考虑如何创建有意义的可视化时,三维和二维之间的差异会产生影响。了解如何解释系数至关重要。机器学习涉及对模型进行战略性迭代和改进。在本周的实验和同行评议中,您将找出线性回归模型的弱点,并对其进行战略性改进。希望随着您在本课程专业化方面的进步,您能在这一迭代过程中越做越好。

涵盖的内容

4个视频5篇阅读材料1个测验1个编程作业1次同伴评审

尽管逻辑回归的名字可能会让人联想到其他方面,但本周我们将把注意力从回归任务转移到分类任务上。逻辑回归是广义线性模型的一种特殊情况。与线性回归一样,逻辑回归是一种广泛使用的统计工具,也是数据科学工具包的基础工具之一。分类任务在现实世界中有很多应用,包括金融和生物医学领域。在本周的实验中,您将看到这一经典算法如何帮助您预测著名的威斯康星乳腺癌数据集中的活检切片显示的是良性还是恶性肿块。我们还建议您在本周开始第 7 周课程的期末项目。本周,请找到一个项目数据集,开始执行 EDA 并定义您的问题。使用项目评分标准作为指导,不要害怕查看几个数据集,直到找到适合项目的数据集为止。

涵盖的内容

4个视频6篇阅读材料1个测验1个编程作业1次同伴评审

本周我们将学习非参数模型。决策树是一种监督学习模型,可用于回归或分类任务。在模块 2 中,我们学习了偏差与方差的权衡,在课程学习过程中,我们一直将这一权衡牢记于心。高度灵活的树状模型的好处是可以捕捉复杂的非线性关系。但是,它们容易出现过度拟合。本周和下周,我们将探索剪枝等策略,以避免基于树的模型过度拟合。在本周的实验中,您将为著名的 MNIST 数据集制作一个 KNN 分类器,然后使用决策树模型建立一个垃圾邮件分类器。 本周我们将再次领略简单易懂的模型的威力。继续完成最终项目一旦你确定了数据集和 EDA,就开始为你的主要监督学习任务制定初步方法。回顾课程材料、阅读研究论文、查看 GitHub 存储库和 Medium 文章,以了解您的主题并规划您的方法。

涵盖的内容

5个视频6篇阅读材料1个测验1个编程作业1次同伴评审

上周,我们学习了树模型。尽管树模型有很多优点,但它们也有一些难以克服的弱点。本周我们将学习集合方法,以克服树模型的过拟合倾向。在许多机器学习竞赛中,优胜者都会使用集合方法,汇总多个树模型的预测结果。本周您将首先学习随机森林和袋集,这是一种用训练数据的不同子集样本来训练相同算法的技术。然后,您将学习提升法(boosting),这是一种模型顺序训练的集合方法。您将了解两种基本的提升算法:AdaBoost 和梯度提升。本周,进行期末项目的主要分析。迭代并改进您的模型。比较不同的模型。进行超参数优化。有时,机器学习项目的这一部分会让人感觉枯燥乏味,但希望看到你的成绩有所提高。

涵盖的内容

4个视频5篇阅读材料1个测验1个编程作业1次同伴评审

本周我们将探讨另一个高级课题--支持向量机。不要被这个名字吓到。本周,我们将了解这种强大的监督学习模型。希望你们能对一些基本概念有直观的理解,比如硬边际和软边际的区别、内核技巧和超参数调整。下周,你将提交最终项目的三个交付成果:报告、视频演示和 GitHub 存储库链接。假设您的目标是在本周完成模型迭代、超参数优化等工作。在这种情况下,您可以在下周润色您的报告,确保您的 GitHub 存储库已为同行评审做好准备,并对您的工作进行出色的演示。

涵盖的内容

4个视频4篇阅读材料1个测验1个编程作业1次同伴评审

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

攻读学位

课程 是 University of Colorado Boulder提供的以下学位课程的一部分。如果您被录取并注册,您已完成的课程可计入您的学位学习,您的学习进度也可随之转移。

 

位教师

授课教师评分
3.1 (36个评价)
Geena Kim
University of Colorado Boulder
3 门课程28,550 名学生

提供方

从 机器学习 浏览更多内容

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.
自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'
Jennifer J.
自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'
Larry W.
自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'
Chaitanya A.
''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'

学生评论

3.3

82 条评论

  • 5 stars

    35.36%

  • 4 stars

    20.73%

  • 3 stars

    8.53%

  • 2 stars

    9.75%

  • 1 star

    25.60%

显示 3/82 个

JT
4

已于 Nov 12, 2024审阅

MH
5

已于 May 20, 2022审阅

XX
4

已于 Apr 4, 2024审阅

Coursera Plus

通过 Coursera Plus 开启新生涯

无限制访问 10,000+ 世界一流的课程、实践项目和就业就绪证书课程 - 所有这些都包含在您的订阅中

通过在线学位推动您的职业生涯

获取世界一流大学的学位 - 100% 在线

加入超过 3400 家选择 Coursera for Business 的全球公司

提升员工的技能,使其在数字经济中脱颖而出

常见问题