University of Illinois Urbana-Champaign
会计数据分析基础 II
University of Illinois Urbana-Champaign

会计数据分析基础 II

Robert J. Brunner

位教师:Robert J. Brunner

3,809 人已注册

包含在 Coursera Plus

深入了解一个主题并学习基础知识。
4.5

(11 条评论)

初级 等级
无需具备相关经验
7 周 完成
在 10 小时 一周
灵活的计划
自行安排学习进度
深入了解一个主题并学习基础知识。
4.5

(11 条评论)

初级 等级
无需具备相关经验
7 周 完成
在 10 小时 一周
灵活的计划
自行安排学习进度

要了解的详细信息

可分享的证书

添加到您的领英档案

作业

9 项作业

授课语言:英语(English)

了解顶级公司的员工如何掌握热门技能

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

该课程共有9个模块

您将熟悉课程、同学和我们的学习环境。迎新会还将帮助您掌握课程所需的技术技能。

涵盖的内容

3个视频5篇阅读材料1个作业1个讨论话题

本模块通过介绍机器学习背后的基本概念,特别是如何使用 Python 和 scikit learn 机器学习模块进行机器学习,为课程的其余部分奠定基础。首先,您将了解机器学习和人工智能如何颠覆企业。其次,您将了解机器学习的基本类型,以及如何在 Python 脚本中利用这些算法。第三,您将了解如何将线性回归视为一个机器学习问题,其参数必须通过最小化成本函数来计算确定。最后,您将学习基于邻域的算法,包括 k 近邻算法,该算法可用于分类和回归任务。

涵盖的内容

4个视频3篇阅读材料1个作业1个编程作业4个非评分实验室

本模块介绍几种最重要的机器学习算法:逻辑回归、决策树和支持向量机。在这三种算法中,第一种,逻辑回归,是一种分类算法(尽管它的名字如此)。而其他两种算法既可用于分类任务,也可用于回归任务。因此,本模块将深入探讨机器分类的概念,即算法从现有的标注数据中学习,将新的、未见过的数据归入特定类别;以及机器回归的概念,即算法从数据中学习模型,对新的、未见过的数据进行预测。虽然这些算法的数学基础各不相同,但它们通常用于对数字、文本和图像数据进行分类,或在各种领域进行回归。本模块还将介绍量化分类和回归算法性能的不同技术,以及如何处理不平衡的训练数据。

涵盖的内容

5个视频4篇阅读材料1个作业1个编程作业4个非评分实验室

本模块介绍了机器学习中几个重要而实用的概念。首先,您将了解将数据分析(尤其是机器学习)应用于现实世界数据集的内在挑战。本课还介绍了未来可能遇到的几种方法,这些方法决定了如何接近、处理和部署数据分析解决方案。接下来,您将学习一种强大的技术,通过称为集合学习的过程,将许多弱学习者的预测结合起来,从而做出更好的预测。具体来说,本模块将介绍两种最流行的集合学习技术:bagging 和 boosting,并演示如何在 Python 数据分析脚本中使用它们。最后,将介绍机器学习管道的概念,它概括了创建、部署和重用机器学习模型的过程。

涵盖的内容

5个视频3篇阅读材料1个作业1个编程作业4个非评分实验室

本模块介绍正则化的概念、正则化在机器学习分析中可能导致的问题以及克服正则化的技术。首先,介绍过拟合的基本概念以及识别过拟合的方法。接着,介绍交叉验证技术,该技术可以降低发生过拟合的可能性。接下来,介绍如何使用交叉验证来确定在给定数据集上训练的机器学习算法的最佳参数。最后,介绍了正则化的概念,即在确定最佳机器学习模型参数时应用额外的惩罚项,并针对不同的回归和分类算法进行了演示。

涵盖的内容

5个视频4篇阅读材料1个作业1个编程作业4个非评分实验室

本模块首先讨论在生产环境中部署的实用机器学习工作流,强调机器学习的全局观。接下来,本模块将介绍另外两种基本算法:天真贝叶斯和高斯过程。这两种算法都以概率论为基础,但运行假设截然不同。天真贝叶斯通常用于分类任务,而高斯过程通常用于回归任务。本模块还讨论了构建机器学习工作流程的实际问题。

涵盖的内容

4个视频4篇阅读材料1个作业1个编程作业3个非评分实验室

本模块介绍机器学习中的一个重要概念,即选择机器学习算法将使用的实际特征。与数据清理一样,数据分析过程中的这一步骤也极为重要,但作为提高分析整体性能的一种方法,它却经常被忽视。本模块的开头讨论了机器学习中的道德问题,这在很大程度上是因为特征的选择会对(有时)算法的最终性能产生非显而易见的影响。当机器学习应用于受监管行业的数据时,或者当算法的不当应用可能导致歧视时,这一点可能非常重要。本模块的其余部分将介绍从数据集中选择最佳特征或从现有特征集中构建新特征的不同技术。

涵盖的内容

5个视频4篇阅读材料1个作业1个编程作业4个非评分实验室

本模块介绍聚类,即根据某些特定属性(如空间距离或点的局部密度)将数据点分配到更大的点群中。人类通常能在给定的数据集中轻松找到直观的聚类,但在计算上,这个问题更具挑战性。本模块首先探讨了这种无监督学习技术背后的基本思想,以及企业可以使用聚类的不同领域。接下来,将介绍最流行的聚类技术之一 K-means。接下来介绍基于密度的 DB-SCAN 技术。最后,本模块将介绍混合模型技术,以概率方式将点分配到聚类中。

涵盖的内容

5个视频5篇阅读材料1个作业1个编程作业4个非评分实验室

本模块介绍异常点或离群点的概念,以及识别这些异常数据点的不同技术。首先,讨论异常点的一般概念,并通过欺诈检测在商业界进行演示,一般来说,与正常客户或业务相比,欺诈应属于异常点。接下来,介绍了识别异常值的统计技术,通常涉及简单的描述性统计,可以突出显示与给定数据集的正常值相差甚远的数据。最后,介绍了机器学习技术,这些技术可以对异常值进行分类,或将低密度(或超出正常聚类)区域的点识别为潜在异常值。

涵盖的内容

4个视频4篇阅读材料1个作业1个编程作业3个非评分实验室1个插件

位教师

Robert J. Brunner
University of Illinois Urbana-Champaign
7 门课程27,552 名学生

提供方

从 业务要点 浏览更多内容

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.
自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'
Jennifer J.
自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'
Larry W.
自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'
Chaitanya A.
''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'

学生评论

4.5

11 条评论

  • 5 stars

    81.81%

  • 4 stars

    0%

  • 3 stars

    9.09%

  • 2 stars

    0%

  • 1 star

    9.09%

显示 3/11 个

AD
5

已于 Jun 22, 2019审阅

Coursera Plus

通过 Coursera Plus 开启新生涯

无限制访问 10,000+ 世界一流的课程、实践项目和就业就绪证书课程 - 所有这些都包含在您的订阅中

通过在线学位推动您的职业生涯

获取世界一流大学的学位 - 100% 在线

加入超过 3400 家选择 Coursera for Business 的全球公司

提升员工的技能,使其在数字经济中脱颖而出

常见问题