Packt

使用 Pandas 的中级 Data Analysis 技术

通过 Coursera Plus 提高技能,仅需 239 美元/年(原价 399 美元)。立即节省

Packt

使用 Pandas 的中级 Data Analysis 技术

包含在 Coursera Plus

深入了解一个主题并学习基础知识。

13 条评论

中级 等级

推荐体验

1 周 完成
在 10 小时 一周
灵活的计划
自行安排学习进度
深入了解一个主题并学习基础知识。

13 条评论

中级 等级

推荐体验

1 周 完成
在 10 小时 一周
灵活的计划
自行安排学习进度

您将学到什么

  • 在 Pandas 中使用高级数据选择和列操作技术。

  • 采用各种过滤技术,提高数据提取精度。

  • 熟练应用 Pandas 方法,有效清理和准备数据。

  • 在 Pandas 中管理和处理多索引和文本数据,实现全面的数据处理。

要了解的详细信息

可分享的证书

添加到您的领英档案

作业

8 项作业

授课语言:英语(English)

了解顶级公司的员工如何掌握热门技能

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

积累特定领域的专业知识

本课程是 使用 Pandas 和 Python 进行数据分析 专项课程 专项课程的一部分
在注册此课程时,您还会同时注册此专项课程。
  • 向行业专家学习新概念
  • 获得对主题或工具的基础理解
  • 通过实践项目培养工作相关技能
  • 获得可共享的职业证书

该课程共有7个模块

在本模块中,我们将探索在 Pandas 中使用 DataFrames 的基本概念,首先比较 Series 和 DataFrame 的方法和属性。您将学会选择和操作单列和多列,并为 DataFrames 添加新列。我们将介绍使用 value_counts 进行列分析以及处理缺失值的策略。此外,您还将掌握使用 astype 方法进行数据类型转换、使用 sort_values 和 sort_index 对 DataFrames 排序,以及使用 rank 方法对列中的值进行排序。

涵盖的内容

14个视频2篇阅读材料1个作业

在本模块中,我们将深入学习如何在 DataFrames 中过滤数据。您将了解数据集并学习内存优化技术。我们将介绍根据条件过滤行,以及使用 AND (&) 和 OR (|) 等逻辑运算符。我们还将探索 isin、isnull 和 notnull 等高级过滤方法。您还将学习使用 between 方法过滤范围内的数据,使用 duplicated 和 drop_duplicates 方法识别和处理重复数据,以及使用 unique 和 nunique 方法查找和统计唯一值。

涵盖的内容

10个视频1个作业

在本模块中,我们将探索 Pandas 中的基本数据提取技术。首先介绍数据集,然后学习使用 set_index 和 reset_index 方法设置和重置索引。我们将介绍使用 iloc 按索引位置检索行和使用 loc 按标签检索行,并了解用于精确数据检索的第二个参数。您还将学习覆盖单个值和多个值、重命名索引标签或列以及删除行或列。此外,还将学习高级提取技术,如使用 sample 方法采样、使用 nsmallest 和 nlargest 提取特定行、使用 where 进行条件筛选,以及使用 apply 跨 DataFrame 行或列执行函数。

涵盖的内容

13个视频1个作业

在本模块中,我们将重点讨论如何在 Pandas 中处理文本数据。首先介绍数据集,然后学习使用常用字符串方法来处理文本数据。我们将介绍使用字符串方法过滤 DataFrame 行,并将这些方法应用于 DataFrame 的索引和列。您将掌握将文本数据分为多个部分的 split 方法,并通过其他练习来提高您的技能。最后,您将学习使用 split 方法的 expand 和 n 参数自定义文本分割,以便进行更详细的分析。

涵盖的内容

7个视频1个作业

在本模块中,我们将从介绍 MultiIndex 的概念开始,探索 Pandas 中 MultiIndex 的高级功能。您将学习创建和管理多索引数据框,以进行复杂的数据分组和分析。我们将介绍提取和重命名索引级别值以提高清晰度的技术,以及如何排序和提取特定行以更好地组织数据。此外,您还将掌握转置、堆叠和解堆叠等方法来重塑 DataFrames,并应用 pivot、melt 和 pivot_table 方法来有效地重组和转换数据。

涵盖的内容

12个视频1个作业

在本模块中,我们将深入研究 Pandas 中的 GroupBy 功能,首先介绍其用于数据聚合的基本概念。您将学习使用 groupby 方法对数据进行分组,并使用 get_group 方法检索特定分组。我们将探索 GroupBy 对象上可用的各种聚合方法,并介绍通过多列对数据进行分组的技巧。此外,您还将掌握对分组数据应用多种操作的 agg 方法,并学习遍历分组以处理单个数据。

涵盖的内容

7个视频1个作业

在本模块中,我们将探索在 Pandas 中合并 DataFrames 的基本技术。首先,我们将介绍各种合并方法,然后详细介绍如何使用 pd.concat 函数沿指定轴串联 DataFrames。我们将介绍左连接和使用 left_on 和 right_on 参数进行特定列匹配,以及根据相交键合并 DataFrames 的内连接。此外,您还将学习全外连接,以合并数据帧,包括两个帧中的所有键,以及如何使用 left_index 和 right_index 参数按索引进行合并。最后,您还将学习 join 方法,这是合并 DataFrames 的一种更简单的替代方法。

涵盖的内容

10个视频1篇阅读材料2个作业

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

位教师

Packt - Course Instructors
Packt
1,611 门课程467,858 名学生

提供方

Packt

从 数据分析 浏览更多内容

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'

Jennifer J.

自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'

Larry W.

自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'

Chaitanya A.

''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'
Coursera Plus

通过 Coursera Plus 开启新生涯

无限制访问 10,000+ 世界一流的课程、实践项目和就业就绪证书课程 - 所有这些都包含在您的订阅中

通过在线学位推动您的职业生涯

获取世界一流大学的学位 - 100% 在线

加入超过 3400 家选择 Coursera for Business 的全球公司

提升员工的技能,使其在数字经济中脱颖而出

常见问题