IBM
使用 R 进行数据分析
IBM

使用 R 进行数据分析

本课程是多个项目的一部分。

Tiffany Zhu
Yiwen Li
Gabriela de Queiroz

位教师:Tiffany Zhu

34,631 人已注册

包含在 Coursera Plus

深入了解一个主题并学习基础知识。
4.7

(338 条评论)

中级 等级
需要一些相关经验
灵活的计划
2 周 在 10 小时 一周
自行安排学习进度
95%
大多数学生喜欢此课程
深入了解一个主题并学习基础知识。
4.7

(338 条评论)

中级 等级
需要一些相关经验
灵活的计划
2 周 在 10 小时 一周
自行安排学习进度
95%
大多数学生喜欢此课程

您将学到什么

  • 通过处理缺失值、格式化和标准化数据、二值化以及将分类值转化为数值,为分析做好数据准备。

  • 比较和对比使用简单线性、多重线性和多项式回归方法的预测模型。

  • 使用描述性统计、数据分组、方差分析(ANOVA)和相关统计来检查数据。

  • 评估模型的过拟合和欠拟合情况,并利用正则化和网格搜索调整其性能。

要了解的详细信息

可分享的证书

添加到您的领英档案

授课语言:英语(English)

了解顶级公司的员工如何掌握热门技能

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

积累特定领域的专业知识

此课程作为 的一部分提供
在注册此课程时,您还需要选择一个特定的合作项目。
  • 向行业专家学习新概念
  • 获得对主题或工具的基础理解
  • 通过实践项目培养工作相关技能
  • 获得可共享的职业证书

该课程共有6个模块

所有数据分析都始于您需要解决的问题,而了解您的数据以及您可以回答的问题类型则是其中的关键环节。R 编程语言提供了进行强大数据分析所需的所有工具,是数据与要解决的实际问题之间的桥梁。 在本模块中,你将回顾可以用 R 语言解决的一类问题,以及构成分析基础的底层数据。您还将了解用于数据分析的 R 软件包,这些软件包提供了一套您在日常数据分析中可能会用到的强大工具。最后,您将了解如何导入数据并从数据集中获得基本见解。

涵盖的内容

6个视频1篇阅读材料2个作业1个应用程序项目1个插件

数据整理或数据预处理是实现准确、完整数据分析的第一步。这一过程将原始数据转换成一种可以轻松分类或映射到其他数据的格式,在它们之间建立可预测的关系,并使您更容易建立所需的模型来回答有关数据的问题。 本模块将介绍如何使用 R 进行数据预处理,然后为您提供所需的工具来识别和处理数据集中的缺失值、转换数据格式以使其与您可能想要比较的其他数据保持一致、对数据进行归一化处理、通过数据分档创建信息类别,以及将分类变量转换为可用于基于数值分析的定量值。

涵盖的内容

6个视频1篇阅读材料2个作业1个应用程序项目1个插件

探索性数据分析,或称 EDA,是一种分析数据的方法,它总结了数据的主要特征,帮助你更好地理解数据集,发现不同变量之间的关系,并为你试图解决的问题提取重要变量。 在本模块中,您要回答的主要问题是"航班延误的原因是什么?在本模块中,您将学习一些有用的探索性数据分析技术,这些技术将有助于回答这个问题。

涵盖的内容

5个视频1篇阅读材料2个作业1个应用程序项目1个插件

您已经确定了要解决的问题,预处理了分析中要用到的数据集,并进行了一些探索性数据分析,回答了一些初步问题。现在,是开发模型和评估假设强度的时候了。 在本模块中,您将尝试使用航空公司数据集预测航班的到达延误时间,从而检验模型的开发。您将学习用于确定数据集中变量之间相关性的回归技术,并通过直观和指标计算对结果进行评估。

涵盖的内容

7个视频1篇阅读材料2个作业1个应用程序项目1个插件

您对数据有了深入的了解,并对数据进行了预处理,以确保获得最佳结果。您还进行了探索性数据分析并开发了模型。到目前为止,一切看起来都很顺利,但您如何确定您的模型在现实世界中能正常运行并达到最佳效果呢? 在本模块中,您将学习如何使用 Tidymodels 框架来评估您的模型。Tidymodels 是使用整齐逆原理进行建模和机器学习的软件包集合。通过使用这些软件包,您将学会如何交叉验证模型、识别潜在问题(如过拟合和欠拟合),以及如何使用正则化技术处理过拟合问题。您还将学习如何使用网格搜索调整模型。

涵盖的内容

4个视频1篇阅读材料2个作业1个应用程序项目1个插件

涵盖的内容

4篇阅读材料1个作业1次同伴评审2个应用程序项目3个插件

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

位教师

授课教师评分
4.6 (84个评价)
Tiffany Zhu
IBM
2 门课程47,737 名学生
Yiwen Li
IBM
2 门课程47,737 名学生
Gabriela de Queiroz
IBM
2 门课程47,737 名学生

提供方

IBM

从 数据分析 浏览更多内容

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.
自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'
Jennifer J.
自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'
Larry W.
自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'
Chaitanya A.
''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'

学生评论

4.7

338 条评论

  • 5 stars

    80.82%

  • 4 stars

    12.09%

  • 3 stars

    3.24%

  • 2 stars

    1.47%

  • 1 star

    2.35%

显示 3/338 个

CB
5

已于 Dec 2, 2022审阅

PG
5

已于 Jul 24, 2022审阅

RM
4

已于 Sep 23, 2022审阅

Coursera Plus

通过 Coursera Plus 开启新生涯

无限制访问 10,000+ 世界一流的课程、实践项目和就业就绪证书课程 - 所有这些都包含在您的订阅中

通过在线学位推动您的职业生涯

获取世界一流大学的学位 - 100% 在线

加入超过 3400 家选择 Coursera for Business 的全球公司

提升员工的技能,使其在数字经济中脱颖而出

常见问题

¹ 本课程的部分作业采用 AI 评分。对于这些作业,将根据 Coursera 隐私声明使用您的数据。