IBM
IBM 数据工程 专业证书
IBM

IBM 数据工程 专业证书

为成为数据工程师做好准备. 掌握就业所需的技能,以及必须掌握的 AI 技能,以适应紧缺职业。获得 IBM 颁发的证书。 无需任何经验。

IBM Skills Network Team
Muhammad Yahya
Abhishek Gagneja

位教师:IBM Skills Network Team

135,022 人已注册

包含在 Coursera Plus

获得职业证书,展示您的专业知识
4.7

(6,227 条评论)

初级 等级

推荐体验

灵活的计划
6 月 在 10 小时 一周
自行安排学习进度
攻读学位
获得职业证书,展示您的专业知识
4.7

(6,227 条评论)

初级 等级

推荐体验

灵活的计划
6 月 在 10 小时 一周
自行安排学习进度
攻读学位

您将学到什么

  • 掌握数据工程师在日常工作中使用的最新实用技能和知识

  • 学习创建、设计和管理关系数据库,并将数据库管理 (DBA) 概念应用于 MySQL、PostgreSQL 和 IBM Db2 等 RDBMS。

  • 使用 MongoDB、Cassandra、Cloudant、Hadoop、Apache Spark、Spark SQL、Spark ML 和 Spark Streaming 开发有关 NoSQL 和大数据的工作知识

  • 使用 Bash、Airflow 和 Kafka 实施 ETL 和数据管道;构建、填充和部署数据仓库;创建 BI 报告和交互式仪表板

要了解的详细信息

可分享的证书

添加到您的领英档案

授课语言:英语(English)

了解顶级公司的员工如何掌握热门技能

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

专业认证 - 16门课程系列

数据工程概论

数据工程概论

第 1 门课程13小时

您将学到什么

  • 列出初级数据工程职位所需的基本技能。

  • 讨论数据工程生命周期的各个阶段和概念。

  • 描述关系数据库、NoSQL 数据存储和大数据引擎等数据工程技术。

  • 总结数据安全、治理和合规方面的概念。

您将获得的技能

类别:数据管道
类别:提取、转换、加载
类别:数据仓库
类别:数据安全
类别:数据架构
类别:数据存储
类别:数据治理
类别:Apache Spark
类别:大数据
类别:SQL
类别:NoSQL
类别:关系数据库
类别:Apache Hadoop
类别:数据科学
类别:数据湖
类别:数据库

您将学到什么

  • 通过学习基本语法、数据类型、表达式、变量和 String 操作,培养对 Python 编程的基础理解。

  • 使用数据结构、条件和分支、Loop、函数、异常处理、对象和类应用 Python 编程逻辑。

  • 熟练使用 Pandas 和 Numpy 等 Python 库,并使用 Jupyter Notebook 开发代码。

  • 通过使用请求处理 REST API 和使用 BeautifulSoup 执行网络刮擦,访问和提取基于网络的数据。

您将获得的技能

类别:Python 程序设计
类别:Pandas(Python 软件包)
类别:数据结构
类别:网页抓取
类别:NumPy
类别:数据操作
类别:应用编程接口 (API)
类别:面向对象编程(OOP)
类别:JSON
类别:脚本
类别:数据处理
类别:数据分析
类别:数据导入/导出
类别:计算机编程
类别:编程原则
类别:还原式 API
类别:自动化
类别:Jupyter

您将学到什么

  • 展示使用 Python 处理和操作数据的技能

  • 使用 Python 实施网络抓取并使用 API 提取数据

  • 扮演数据工程师的角色,在实际项目中提取、转换和加载数据

  • 使用 Jupyter 笔记本和集成开发环境完成项目

您将获得的技能

类别:数据操作
类别:网页抓取
类别:提取、转换、加载
类别:Python 程序设计
类别:数据库
类别:单元测试
类别:代码审查
类别:还原式 API
类别:数据转换
类别:集成开发环境
类别:应用编程接口 (API)
类别:SQL
类别:风格指南
类别:数据处理
关系数据库 (RDBMS) 简介

关系数据库 (RDBMS) 简介

第 4 门课程15小时

您将学到什么

  • 描述数据、数据库、关系数据库和云数据库。

  • 描述信息和数据模型、关系数据库和关系模型概念(包括模式和表格)。

  • 解释实体关系图,并为特定用例设计关系数据库。

  • 掌握常用数据库管理系统的工作知识,包括 MySQL、PostgreSQL 和 IBM DB2

您将获得的技能

类别:关系数据库
类别:数据库设计
类别:SQL
类别:PostgreSQL
类别:MySQL
类别:数据操作
类别:数据库架构与管理
类别:数据完整性
类别:数据库管理系统
类别:数据库
类别:数据建模
类别:数据管理
类别:IBM DB2
类别:命令行界面

您将学到什么

  • 使用 SQL 和 Python 分析数据库中的数据。

  • 创建关系数据库,并使用 DDL 命令处理多个表。

  • 使用 DML 命令构建基本至中级 SQL 查询。

  • 利用视图、事务、存储过程和连接等高级 SQL 技术,编写功能更强大的查询。

您将获得的技能

类别:SQL
类别:Pandas(Python 软件包)
类别:关系数据库
类别:Jupyter
类别:数据库
类别:数据分析
类别:数据操作
类别:事务处理
类别:Query 语言
类别:Python 程序设计
类别:存储过程

您将学到什么

  • 描述 Linux 体系结构和常见的 Linux 发行版,在 Linux 系统上更新和安装软件。

  • 在 Bash shell 中执行常见的信息、文件、内容、导航、压缩和网络命令。

  • 使用 Linux 命令、环境变量、管道和过滤器开发 shell 脚本。

  • 使用 crontab 在 Linux 中安排 cron 作业,并解释 cron 语法。

您将获得的技能

类别:Linux 命令
类别:外壳脚本
类别:Linux
类别:Unix 命令
类别:Unix
类别:脚本
类别:文件管理
类别:Linux 服务器
类别:Bash(脚本语言)
类别:脚本语言
类别:命令行界面
类别:乌班图
类别:操作系统
类别:自动化
类别:软件安装
类别:网络协议
关系数据库管理(DBA)

关系数据库管理(DBA)

第 7 门课程21小时

您将学到什么

  • 创建、查询和配置数据库,访问和构建表格等系统对象。

  • 执行基本的数据库管理,包括备份和恢复数据库以及管理用户角色和权限。

  • 监控和优化数据库性能的重要方面。

  • 排除连接、登录和配置等数据库问题,并自动执行报告、通知和警报等功能。

您将获得的技能

类别:数据库管理
类别:数据库架构与管理
类别:MySQL
类别:关系数据库
类别:加密
类别:数据库系统
类别:数据库管理员
类别:数据库设计
类别:灾难恢复
类别:Operator 数据库
类别:IBM DB2
类别:系统监控
类别:数据存储技术
类别:性能调整
类别:基于角色的访问控制(RBAC)
类别:用户账户
类别:PostgreSQL

您将学到什么

  • 描述并对比提取、转换、加载(ETL)流程和提取、加载、转换(ELT)流程。

  • 解释批处理与并发执行模式。

  • 通过 bash 和 Python 函数实现 ETL 工作流程。

  • 描述数据管道组件、流程、工具和技术。

您将获得的技能

类别:数据管道
类别:提取、转换、加载
类别:阿帕奇气流
类别:Apache Kafka
类别:外壳脚本
类别:大数据
类别:数据处理
类别:Unix Shell
类别:可扩展性
类别:数据转换
类别:命令行界面
类别:数据仓库
类别:性能调整
类别:数据迁移
类别:数据整合
类别:Data Mart
类别:网页抓取
数据仓库基础知识

数据仓库基础知识

第 9 门课程15小时

您将学到什么

  • 在短短 6 周内掌握可直接就业的数据仓库技能,并获得实践经验和 IBM 证书的支持。

  • 设计和填充数据仓库,使用 CUBE、ROLLUP 和物化视图建模和查询数据。

  • 识别流行的数据分析和商业智能工具及供应商,并使用 IBM Cognos Analytics 创建数据可视化。

  • 如何设计数据并将其 Load 到数据 Warehouse 中、编写聚合查询、创建 Materialized 查询表以及创建分析仪表板。

您将获得的技能

类别:数据仓库
类别:数据湖
类别:星形模式
类别:Data Mart
类别:雪花模式
类别:IBM DB2
类别:Query 语言
类别:数据清理
类别:SQL
类别:数据架构
类别:数据库系统
类别:提取、转换、加载
类别:PostgreSQL
类别:数据整合
类别:数据建模
类别:数据质量
类别:数据库设计
类别:数据验证

您将学到什么

  • 探索分析和商业智能(BI)工具的用途

  • 了解 IBM Cognos Analytics 和 Google Looker Studio 的功能

  • 利用 IBM Cognos Analytics 展示您分析 DB2 数据的能力

  • 使用 IBM Cognos Analytics 和 Google Looker Studio 创建和共享交互式 Dashboard

您将获得的技能

类别:IBM Cognos 分析
类别:Looker (软件)
类别:数据可视化软件
类别:仪表板
类别:交互式数据可视化
类别:分析
类别:商业智能软件
类别:数据展示
类别:数据可视化
类别:商业智能
NoSQL 数据库简介

NoSQL 数据库简介

第 11 门课程18小时

您将学到什么

  • 区分 NoSQL 存储库的四大类别。

  • 描述比较流行的大数据处理工具的特点、功能、优势、局限性和应用。

  • 使用 MongoDB 任务执行常见任务,包括创建、读取、更新和删除(CRUD)操作。

  • 在 Cassandra 中执行键空间、表和 CRUD 操作。

您将获得的技能

类别:NoSQL
类别:Apache Cassandra
类别:MongoDB
类别:数据建模
类别:Query 语言
类别:可扩展性
类别:分布式计算
类别:数据操作
类别:数据库
类别:JSON
类别:IBM 云
类别:数据库管理
类别:数据库架构与管理

您将学到什么

  • 解释大数据的影响,包括使用案例、工具和处理方法。

  • 介绍 Apache Hadoop 架构、生态系统、实践和用户相关应用,包括 Hive、HDFS、HBase、Spark 和 MapReduce。

  • 应用 Spark 编程基础,包括数据帧、数据集和 Spark SQL 的并行编程基础。

  • 使用 Spark 的 RDD 和数据集,使用 Catalyst 和 Tungsten 优化 Spark SQL,以及使用 Spark 的开发和运行环境选项。

您将获得的技能

类别:Apache Spark
类别:分布式计算
类别:大数据
类别:Apache Hadoop
类别:可扩展性
类别:调试
类别:Apache Hive
类别:IBM 云
类别:数据处理
类别:PySpark
类别:Docker (软件)
类别:Kubernetes
类别:数据转换
类别:性能调整
使用 Apache Spark 进行机器学习

使用 Apache Spark 进行机器学习

第 13 门课程15小时

您将学到什么

  • 描述 ML,解释其在数据工程中的作用,总结生成式人工智能,讨论 Spark 的用途,分析 ML 管道和模型持久性。

  • 评估 ML 模型,区分回归、分类和聚类模型,比较数据工程管道和 ML 管道。

  • 使用 Spark SQL 构建数据分析流程,并使用 SparkML 执行回归、分类和聚类。

  • 演示连接 Spark 集群、构建 ML 管道、执行特征提取和转换以及模型持久性。

您将获得的技能

类别:机器学习
类别:Apache Spark
类别:提取、转换、加载
类别:回归分析
类别:PySpark
类别:监督学习
类别:功能工程
类别:数据转换
类别:数据管道
类别:预测建模
类别:无监督学习
类别:Apache Hadoop
类别:应用机器学习
类别:数据处理
类别:生成式人工智能
数据工程顶点项目

数据工程顶点项目

第 14 门课程17小时

您将学到什么

  • 熟练掌握初级数据工程职位所需的技能。

  • 设计和实施数据工程生命周期中的各种概念和组件,如数据存储库。

  • 展示有关关系数据库、NoSQL 数据存储、大数据引擎、数据仓库和数据管道的工作知识。

  • 应用 Linux shell 脚本、SQL 和 Python 编程语言技能解决数据工程问题。

您将获得的技能

类别:提取、转换、加载
类别:SQL
类别:数据仓库
类别:大数据
类别:MySQL
类别:Apache Spark
类别:数据管道
类别:数据分析
类别:仪表板
类别:MongoDB
类别:NoSQL
类别:Python 程序设计
类别:应用机器学习
类别:IBM DB2
类别:数据基础设施
类别:PostgreSQL
类别:数据架构
类别:数据库
类别:关系数据库
类别:IBM Cognos 分析

您将学到什么

  • 在各行业的数据工程流程中利用各种 AI 生成工具和技术

  • 使用生成式 AI 工具实施数据生成、Augmentation 和匿名化等各种数据工程流程

  • 在数据仓库模式设计和基础架构设置的实践实验室和项目中练习 AI 生成技能

  • 评估实际案例研究,展示生成式 AI 在 ETL 和数据存储库中的成功应用

您将获得的技能

类别:生成式人工智能
类别:数据分析
类别:数据综合
类别:提取、转换、加载
类别:数据仓库
类别:数据管道
类别:人工智能
类别:数据架构
类别:Query 语言
类别:负责任的人工智能
类别:数据伦理
类别:数据基础设施
类别:数据挖掘
类别:数据质量
类别:数据库设计
数据工程职业指南和面试准备

数据工程职业指南和面试准备

第 16 门课程11小时

您将学到什么

  • 描述数据工程师的角色、一些职业选择以及该领域的潜在机会。

  • 解释如何为求职打下基础,包括研究招聘信息、撰写简历和制作作品集。

  • 总结求职者在典型的求职面试周期中可能遇到的情况、不同类型的面试以及如何准备面试。

  • 解释如何进行有效的面试,包括回答问题的技巧和如何进行专业的个人陈述。

您将获得的技能

类别:面试技巧
类别:数据管道
类别:专业网络
类别:专业发展
类别:语言交流技能
类别:数据战略
类别:沟通策略
类别:数据基础设施
类别:技术交流
类别:数据伦理
类别:LinkedIn

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

攻读学位

当您完成本 专业证书后,如果您被以下在线学位课程录取并注册,您的学习成绩可能会被承认为学分¹。

 
ACE 徽标

此 专业证书 具有 ACE® 推荐。它有资格在参与美国诸学院和大学时获得大学学分。注意:接受特定学分建议的决定由每个机构决定。 

位教师

IBM Skills Network Team
IBM
83 门课程1,540,397 名学生
Muhammad Yahya
IBM
5 门课程91,877 名学生
Abhishek Gagneja
IBM
6 门课程238,660 名学生

提供方

IBM

人们为什么选择 Coursera 来帮助自己实现职业发展

Coursera Plus

通过 Coursera Plus 开启新生涯

无限制访问 10,000+ 世界一流的课程、实践项目和就业就绪证书课程 - 所有这些都包含在您的订阅中

通过在线学位推动您的职业生涯

获取世界一流大学的学位 - 100% 在线

加入超过 3400 家选择 Coursera for Business 的全球公司

提升员工的技能,使其在数字经济中脱颖而出

常见问题

¹ Median salary and job opening data are sourced from Lightcast™ Job Postings Report. Content Creator, Machine Learning Engineer and Salesforce Development Representative (1/1/2024 - 12/31/2024) All other job roles (10/1/2024 - 10/1/2025)