IBM
使用 Python 进行机器学习
IBM

使用 Python 进行机器学习

本课程是多个项目的一部分。

Joseph Santarcangelo
Jeff Grossman

位教师:Joseph Santarcangelo

605,589 人已注册

包含在 Coursera Plus

深入了解一个主题并学习基础知识。
4.7

(17,859 条评论)

中级 等级

推荐体验

灵活的计划
2 周 在 10 小时 一周
自行安排学习进度
94%
大多数学生喜欢此课程
深入了解一个主题并学习基础知识。
4.7

(17,859 条评论)

中级 等级

推荐体验

灵活的计划
2 周 在 10 小时 一周
自行安排学习进度
94%
大多数学生喜欢此课程

您将学到什么

  • 解释机器学习中涉及的关键概念、工具和角色,包括监督和非监督学习技术。

  • 使用 Python 和 Scikit-learn 应用核心机器学习算法,如 Regression、分类、Cluster 和降维。

  • 使用适当的指标、验证策略和优化技术评估模型性能。

  • 通过动手实验室、项目和实际评估,在真实数据集上构建和评估端到端 Machine Learning 解决方案。

要了解的详细信息

可分享的证书

添加到您的领英档案

作业

15 项作业

授课语言:英语(English)

了解顶级公司的员工如何掌握热门技能

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

积累特定领域的专业知识

此课程作为 的一部分提供
在注册此课程时,您还需要选择一个特定的合作项目。
  • 向行业专家学习新概念
  • 获得对主题或工具的基础理解
  • 通过实践项目培养工作相关技能
  • 通过 IBM 获得可共享的职业证书

该课程共有6个模块

在本 Module 中,您将探索机器学习的基础概念,为使用 Python 进行实践建模做好准备。您将解释 Python 和 Scikit-learn 在机器学习中的相关性,总结 IBM AI 工程认证路径,并对常见的学习算法类型进行分类。您将概述机器学习模型生命周期的各个阶段,并描述机器学习工程师典型的一天是什么样的。您还将比较 AI 领域的关键角色,识别广泛使用的 Open Source 工具,并学习使用 Scikit-learn 构建和评估简单模型。

涵盖的内容

8个视频2篇阅读材料2个作业1个插件

在本 Modulation 中,您将探索机器学习中使用的两种基本回归技术--线性回归和 Logistic 回归。您将解释回归在预测结果中的作用,描述简单线性回归和多重线性回归之间的区别,并使用 Scikit-learn 在实际数据中应用这两种回归。您还将解读多项式和非线性回归模型如何捕捉复杂的模式。该 Modulation 将介绍 Logistic Regression 这种分类方法,并指导您有效地训练和测试分类模型。为支持您的学习,您将收到一份 "小抄":线性回归和 Logistic 回归》,其中总结了关键概念、公式和 Use Cases。

涵盖的内容

6个视频1篇阅读材料3个作业3个应用程序项目1个插件

在本 Modulation 中,您将构建和评估一系列有监督的机器学习模型,以解决分类和 Regression 问题。首先,您将介绍分类 Model 如何预测 Categorical Data 结果,并使用真实世界的数据实施多类分类策略。然后,您将探索决策树如何进行预测,并将其应用于分类和回归任务。该 Modulation 还包括使用支持向量机 (SVM) 进行欺诈检测,应用 K-Nearest Neighbors (KNN) 进行客户分类,以及训练 Random Forest 和 XGBoighbost 等集合模型以提高准确性和效率。您将区分模型性能中的 Bias 和 Variance,并探索集合方法如何帮助平衡这种权衡。为了支持您的学习,您将收到一份小册子:建立监督学习模型》,其中包含关键术语、模型类型和 Evaluation 提示。

涵盖的内容

6个视频1篇阅读材料3个作业6个应用程序项目1个插件

在本 Modulation 中,您将学习无监督学习技术如何在不使用标记响应的情况下发现数据中的隐藏模式。您将描述 Clustering 概念,并将 K-means 应用到实际的客户细分任务中。您还将比较 DBSCAN 和 HDBSCAN 模型,以识别空间数据中的密集 Cluster。除了 Cluster 之外,您还将探索降维作为简化高维数据集的工具。您将应用 PCA 来发现关键成分,并使用 t-SNE 和 UMAP 等高级技术来实现 Data Structure 的可视化。为了支持您的学习,您将收到一份小册子:建立无监督学习模型》,重点介绍核心方法、实际 Cases 和比较指南。

涵盖的内容

5个视频1篇阅读材料3个作业4个应用程序项目1个插件

在本 Modulation 中,您将学习如何使用行业标准的评估和验证技术来评估机器学习模型的有效性。您将解释关键的 Classification 和 Regression 指标,使用真实世界的数据评估 Model,并使用混淆矩阵和 Feature 重要性图表等工具解释结果。您将探索如何评估无监督学习中的 Cluster 质量,并应用交叉验证来减少过拟合。该 Modulation 还将介绍 Regularization 方法,以提高模型泛化能力并降低特征复杂度。最后,您将构建完整的 Machine Learning Pipeline,并使用 GridSearchCV 对其进行优化,同时识别数据 Leakage 等常见陷阱。为了支持您的学习,您将收到一份小册子:Evaluating and Validating Machine Learning Models》,内容涵盖关键指标、技术和模型调整策略。

涵盖的内容

6个视频1篇阅读材料3个作业5个应用程序项目1个插件

在最后这个 Modulation 模块中,您将应用并展示在整个课程中获得的全部技能。您将从使用泰坦尼克数据集的实践项目开始,使用管道、交叉验证和超参数调整来构建和优化分类模型。然后,您将利用历史天气数据开发一个降雨预测分类器,从而完成最终项目。这包括数据 Cleaning、Feature Engineering、模型构建和性能评估。课程结束时,您将参加一次分级期末考试,测试您对所有六个 Modulation 知识的掌握情况。该 Modulation 为您提供了在实践和理论环境中展示所学知识的机会。

涵盖的内容

1个视频3篇阅读材料1个作业3个应用程序项目

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

位教师

授课教师评分
4.7 (3,373个评价)
Joseph Santarcangelo
IBM
36 门课程2,171,524 名学生
Jeff Grossman
IBM
3 门课程667,937 名学生

提供方

IBM

从 机器学习 浏览更多内容

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.
自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'
Jennifer J.
自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'
Larry W.
自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'
Chaitanya A.
''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'

学生评论

4.7

17,859 条评论

  • 5 stars

    75.89%

  • 4 stars

    18.63%

  • 3 stars

    3.44%

  • 2 stars

    0.99%

  • 1 star

    1.02%

显示 3/17859 个

RV
5

已于 Jan 14, 2025审阅

RN
5

已于 May 25, 2020审阅

IK
5

已于 Dec 13, 2022审阅

Coursera Plus

通过 Coursera Plus 开启新生涯

无限制访问 10,000+ 世界一流的课程、实践项目和就业就绪证书课程 - 所有这些都包含在您的订阅中

通过在线学位推动您的职业生涯

获取世界一流大学的学位 - 100% 在线

加入超过 3400 家选择 Coursera for Business 的全球公司

提升员工的技能,使其在数字经济中脱颖而出

常见问题