本课程侧重于使用 Excel 进行基本数据分析。学习设计和实施现实的 Prediction 模型,以减少不确定性,从而做出明智的商业决策。在实践项目中,您将充当业务数据分析师,建立模型来评估信用卡申请、最大限度地降低违约风险和最大限度地提高银行利润。您将掌握关键的不确定性测量方法,如分类错误率、信息熵和线性回归的置信区间。作业使用课程中提供的数据和 Excel 基本功能,确保未来业务应用的流畅性。无需事先了解 Excel 高级功能(Visual Basic、数据透视表)。通过学习 Excel 和数据分析技能,您将能够应用基于 Binary Classification、信息论和熵度量以及线性回归的商业数据分析方法,并为担任商业数据分析师等职位做好准备。


了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有7个模块
本课程将帮助您设计和实施基于数据的实际预测模型。在最终项目(模块 6)中,您将扮演银行业务数据分析师的角色,开发两种不同的预测模型,以确定哪些信用卡申请人应该被接受,哪些应该被拒绝。 第一个模型将重点关注违约风险最小化,第二个模型将重点关注银行利润最大化。这两个模型将以一种实用的、实践性的方式向您展示这样一个理念:您对业务指标的选择将推动您对最优模型的选择。本课程试图展示的第二个重要理念是,您的数据分析结果不能也不应该以消除所有不确定性为目标。 作为数据分析师,您的职责是为决策者减少不确定性,减少的幅度在经济上是有价值的,同时量化不确定性仍然存在的程度。您将学习如何计算商业中最重要的不确定性度量,并将其应用到实际案例中,包括分类错误率、信息熵和线性回归的置信区间。课程中提供了您所需的所有数据,所有作业均可在 MS Excel 中完成。本课程将为您提供足够的 Excel 练习,使您能够流利地使用 Excel 中最常用的商务功能,并为学习将来可能需要的任何其他 Excel 功能做好准备(模块 1)。本课程不涉及 Visual Basic 或数据透视表,完成作业也不需要它们。所有高级概念都会在单个 Excel 电子表格模板中进行演示,您可以使用这些模板回答相关问题。您将掌握大量的词汇和实践知识,了解如何应用基于二元分类(模块 2)、信息论和熵度量(模块 3)以及线性回归(模块 4 和 5)的商业数据分析方法,所有这些都不会使用比 Excel 更复杂的软件工具。
涵盖的内容
2个视频3篇阅读材料
在本模块中,您将学习 Excel 的基本技能,以应对未来可能遇到的典型业务情况。本模块中教授的 Excel 词汇和函数使您能够理解本课程后面视频中附加的 Excel 电子表格说明。
涵盖的内容
8个视频1篇阅读材料2个作业
大多数商业数据分析项目的终极目标都是将数据集合分为两类,如 "买这只股票,不买那只股票 "或 "向这个客户提供特价,但不向那个客户提供特价"。有一个专门的衡量标准词汇表,用于比较和优化用于将集合分为两组的算法的性能。您将学习如何以及为什么要应用这些不同的指标,包括如何计算最重要的 AUC:接收者工作特征曲线 (ROC) 下的面积。
涵盖的内容
6个视频1篇阅读材料2个作业
在本模块中,您将学习如何计算和应用被称为 "熵 "的非常有用的不确定性度量。熵 "与人们更熟悉的 "概率 "不同,"概率 "代表的是单一结果发生的不确定性,而 "熵 "则量化所有可能结果的总体不确定性。 熵度量为数据分析工作提供了问责框架。熵使您能够两次量化与业务相关的未来结果的不确定性:在项目开始前使用现有的最佳估计值,然后在建立预测模型后再次使用。 这两种度量方法的区别在于您的工作所带来的信息增益。
涵盖的内容
7个视频1篇阅读材料2个作业
线性相关度量是一个比通常认识到的更丰富的关联评估指标。您可以用它来量化线性模型降低不确定性的程度。 当用于预测未来结果时,它可以转换为 "点估计值 "加 "置信区间",或转换为信息增益度量。您将掌握这些概念的流畅知识,并了解线性回归在商业数据分析中的许多重要用途。本模块还教授如何使用中心极限定理 (CLT) 解决实际问题。这两个主题密切相关,因为线性回归和中心极限定理都使用了被称为 "高斯 "的特殊概率分布族。您将学习在这些和其他情况下使用高斯分布所需的一切知识。
涵盖的内容
11个视频1篇阅读材料3个作业
本模块将为您提供更多与建立高质量模型相关的宝贵概念和技能。 如您所知,"模型 "是对应用于现有数据(输入)的过程的描述,该过程会产生对未来未知结果的估计作为输出。 输出模型通常采用概率分布的形式。本模块包括如何从数据中估计概率分布("概率直方图"),以及如何描述和生成数据科学家使用的最有用的概率分布。本模块还详细介绍了如何开发二元分类模型,并优化参数以最大化 AUC,以及当输入由每个事件的多种类型数据组成时,如何应用线性回归模型。 本模块最后解释了 "过拟合",这是表面上看起来很好的预测模型在实际业务环境中经常失败的主要原因。最后,我们将为您提供一些提示,帮助您在期末项目和现实生活中避免自己的预测模型出现过度拟合。
涵盖的内容
4个视频1篇阅读材料1个作业
期末课程项目是涵盖所有课程材料的综合评估,包括四次小测验和一次同行评议作业。 对于小测验一和小测验二,会有学习要点来解释小测验的内容。 只有在完成测验并取得及格成绩后,这些学习要点才会解锁。在开始之前,请仔细阅读结业项目说明。 根据以往学生的经验,包括所有测验和同行评估在内的最终项目需要 10-12 个小时。
涵盖的内容
2个视频4篇阅读材料4个作业1次同伴评审
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
位教师


从 数据分析 浏览更多内容
- 状态:免费试用
- 状态:免费试用
- 状态:免费试用
人们为什么选择 Coursera 来帮助自己实现职业发展




学生评论
3,940 条评论
- 5 stars
56.28%
- 4 stars
23.96%
- 3 stars
9.16%
- 2 stars
5.30%
- 1 star
5.28%
显示 3/3940 个
已于 Nov 26, 2017审阅
A challenging course that rewards conscientious effort. Heavy on math, both practical and theoretical. Highly recommend comfort with college level statistics before taking this course.
已于 May 7, 2020审阅
Quite comprehensive on the usage of concepts taught in the course. However, bit of diversion seems to come in assignments and quizzes. Overall, very challenging and fulfilling.
已于 Oct 30, 2015审阅
The course deserves a 5-star rating because: (1) content is relevant, (2) the professor is concise and possesses great teaching skills, and (3) the learning modules are applicable to daily problems.
常见问题
完成 Coursera 课程不能获得杜克大学的学分;因此,杜克大学无法为您提供大学成绩单。不过,您的电子证书将被添加到您的成就页面--在那里,您可以打印证书或将其添加到您的 LinkedIn 个人资料中。
要获取课程资料、作业和证书,您需要在注册课程时购买证书体验。 您可以尝试免费试听,或申请资助。课程可能提供 "完整课程,无证书"。通过该选项,您可以查看所有课程资料,提交必要的评估,并获得最终成绩。这也意味着您无法购买证书体验。
注册课程后,您就可以访问专项课程中的所有课程,完成作业后还可以获得证书。您的电子证书将添加到您的 "成就 "页面--在那里,您可以打印证书或将其添加到您的 LinkedIn 个人资料中。
更多问题
提供助学金,
¹ 本课程的部分作业采用 AI 评分。对于这些作业,将根据 Coursera 隐私声明使用您的数据。