Duke University
掌握 Excel 中的数据分析
Duke University

掌握 Excel 中的数据分析

Jana Schaich Borg
Daniel Egger

位教师:Jana Schaich Borg

350,523 人已注册

包含在 Coursera Plus

深入了解一个主题并学习基础知识。
4.2

(3,940 条评论)

初级 等级
无需具备相关经验
灵活的计划
2 周 在 10 小时 一周
自行安排学习进度
94%
大多数学生喜欢此课程
深入了解一个主题并学习基础知识。
4.2

(3,940 条评论)

初级 等级
无需具备相关经验
灵活的计划
2 周 在 10 小时 一周
自行安排学习进度
94%
大多数学生喜欢此课程

您将学到什么

  • 设计并实施切合实际的 Prediction 模型,以减少不确定性,从而做出明智的业务决策。

  • 计算商业中使用的重要不确定性指标,并将其应用到实际案例中。

  • 应用基于二元分类、信息论和熵度量以及线性回归的业务数据分析方法。

要了解的详细信息

可分享的证书

添加到您的领英档案

授课语言:英语(English)

了解顶级公司的员工如何掌握热门技能

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

积累特定领域的专业知识

本课程是 从 Excel 到 MySQL:商业分析技术 专项课程 专项课程的一部分
在注册此课程时,您还会同时注册此专项课程。
  • 向行业专家学习新概念
  • 获得对主题或工具的基础理解
  • 通过实践项目培养工作相关技能
  • 获得可共享的职业证书

该课程共有7个模块

本课程将帮助您设计和实施基于数据的实际预测模型。在最终项目(模块 6)中,您将扮演银行业务数据分析师的角色,开发两种不同的预测模型,以确定哪些信用卡申请人应该被接受,哪些应该被拒绝。 第一个模型将重点关注违约风险最小化,第二个模型将重点关注银行利润最大化。这两个模型将以一种实用的、实践性的方式向您展示这样一个理念:您对业务指标的选择将推动您对最优模型的选择。本课程试图展示的第二个重要理念是,您的数据分析结果不能也不应该以消除所有不确定性为目标。 作为数据分析师,您的职责是为决策者减少不确定性,减少的幅度在经济上是有价值的,同时量化不确定性仍然存在的程度。您将学习如何计算商业中最重要的不确定性度量,并将其应用到实际案例中,包括分类错误率、信息熵和线性回归的置信区间。课程中提供了您所需的所有数据,所有作业均可在 MS Excel 中完成。本课程将为您提供足够的 Excel 练习,使您能够流利地使用 Excel 中最常用的商务功能,并为学习将来可能需要的任何其他 Excel 功能做好准备(模块 1)。本课程不涉及 Visual Basic 或数据透视表,完成作业也不需要它们。所有高级概念都会在单个 Excel 电子表格模板中进行演示,您可以使用这些模板回答相关问题。您将掌握大量的词汇和实践知识,了解如何应用基于二元分类(模块 2)、信息论和熵度量(模块 3)以及线性回归(模块 4 和 5)的商业数据分析方法,所有这些都不会使用比 Excel 更复杂的软件工具。

涵盖的内容

2个视频3篇阅读材料

在本模块中,您将学习 Excel 的基本技能,以应对未来可能遇到的典型业务情况。本模块中教授的 Excel 词汇和函数使您能够理解本课程后面视频中附加的 Excel 电子表格说明。

涵盖的内容

8个视频1篇阅读材料2个作业

大多数商业数据分析项目的终极目标都是将数据集合分为两类,如 "买这只股票,不买那只股票 "或 "向这个客户提供特价,但不向那个客户提供特价"。有一个专门的衡量标准词汇表,用于比较和优化用于将集合分为两组的算法的性能。您将学习如何以及为什么要应用这些不同的指标,包括如何计算最重要的 AUC:接收者工作特征曲线 (ROC) 下的面积。

涵盖的内容

6个视频1篇阅读材料2个作业

在本模块中,您将学习如何计算和应用被称为 "熵 "的非常有用的不确定性度量。熵 "与人们更熟悉的 "概率 "不同,"概率 "代表的是单一结果发生的不确定性,而 "熵 "则量化所有可能结果的总体不确定性。 熵度量为数据分析工作提供了问责框架。熵使您能够两次量化与业务相关的未来结果的不确定性:在项目开始前使用现有的最佳估计值,然后在建立预测模型后再次使用。 这两种度量方法的区别在于您的工作所带来的信息增益。

涵盖的内容

7个视频1篇阅读材料2个作业

线性相关度量是一个比通常认识到的更丰富的关联评估指标。您可以用它来量化线性模型降低不确定性的程度。 当用于预测未来结果时,它可以转换为 "点估计值 "加 "置信区间",或转换为信息增益度量。您将掌握这些概念的流畅知识,并了解线性回归在商业数据分析中的许多重要用途。本模块还教授如何使用中心极限定理 (CLT) 解决实际问题。这两个主题密切相关,因为线性回归和中心极限定理都使用了被称为 "高斯 "的特殊概率分布族。您将学习在这些和其他情况下使用高斯分布所需的一切知识。

涵盖的内容

11个视频1篇阅读材料3个作业

本模块将为您提供更多与建立高质量模型相关的宝贵概念和技能。 如您所知,"模型 "是对应用于现有数据(输入)的过程的描述,该过程会产生对未来未知结果的估计作为输出。 输出模型通常采用概率分布的形式。本模块包括如何从数据中估计概率分布("概率直方图"),以及如何描述和生成数据科学家使用的最有用的概率分布。本模块还详细介绍了如何开发二元分类模型,并优化参数以最大化 AUC,以及当输入由每个事件的多种类型数据组成时,如何应用线性回归模型。 本模块最后解释了 "过拟合",这是表面上看起来很好的预测模型在实际业务环境中经常失败的主要原因。最后,我们将为您提供一些提示,帮助您在期末项目和现实生活中避免自己的预测模型出现过度拟合。

涵盖的内容

4个视频1篇阅读材料1个作业

期末课程项目是涵盖所有课程材料的综合评估,包括四次小测验和一次同行评议作业。 对于小测验一和小测验二,会有学习要点来解释小测验的内容。 只有在完成测验并取得及格成绩后,这些学习要点才会解锁。在开始之前,请仔细阅读结业项目说明。 根据以往学生的经验,包括所有测验和同行评估在内的最终项目需要 10-12 个小时。

涵盖的内容

2个视频4篇阅读材料4个作业1次同伴评审

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

位教师

授课教师评分
4.1 (233个评价)
Jana Schaich Borg
Duke University
7 门课程753,210 名学生
Daniel Egger
Duke University
8 门课程1,245,980 名学生

提供方

Duke University

从 数据分析 浏览更多内容

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.
自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'
Jennifer J.
自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'
Larry W.
自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'
Chaitanya A.
''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'

学生评论

4.2

3,940 条评论

  • 5 stars

    56.28%

  • 4 stars

    23.96%

  • 3 stars

    9.16%

  • 2 stars

    5.30%

  • 1 star

    5.28%

显示 3/3940 个

TR
5

已于 Nov 26, 2017审阅

PS
4

已于 May 7, 2020审阅

JE
5

已于 Oct 30, 2015审阅

Coursera Plus

通过 Coursera Plus 开启新生涯

无限制访问 10,000+ 世界一流的课程、实践项目和就业就绪证书课程 - 所有这些都包含在您的订阅中

通过在线学位推动您的职业生涯

获取世界一流大学的学位 - 100% 在线

加入超过 3400 家选择 Coursera for Business 的全球公司

提升员工的技能,使其在数字经济中脱颖而出

常见问题

¹ 本课程的部分作业采用 AI 评分。对于这些作业,将根据 Coursera 隐私声明使用您的数据。