Packt
Big Data Foundations with Hadoop and Spark 专项课程
Packt

Big Data Foundations with Hadoop and Spark 专项课程

Master Big Data with Hadoop and Spark. Learn Hadoop, Spark, Scala, and Kafka to process, analyze, and stream massive datasets in real time.

包含在 Coursera Plus

深入学习学科知识
中级 等级

推荐体验

4 周 完成
在 10 小时 一周
灵活的计划
自行安排学习进度
深入学习学科知识
中级 等级

推荐体验

4 周 完成
在 10 小时 一周
灵活的计划
自行安排学习进度

您将学到什么

  • Install and configure Hadoop and Spark to manage large-scale datasets effectively.

  • Apply Scala and Spark to build, query, and optimize complex big data pipelines.

  • Process and analyze real-time streaming data using Spark Streaming.

  • Implement Kafka producers, consumers, and advanced operations for scalable solutions.

要了解的详细信息

可分享的证书

添加到您的领英档案

授课语言:英语(English)
最近已更新!

September 2025

了解顶级公司的员工如何掌握热门技能

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

精进特定领域的专业知识

  • 向大学和行业专家学习热门技能
  • 借助实践项目精通一门科目或一个工具
  • 培养对关键概念的深入理解
  • 通过 Packt 获得职业证书

专业化 - 4门课程系列

The Ultimate Hands-On Hadoop

The Ultimate Hands-On Hadoop

第 1 门课程20小时

您将学到什么

  • Remember Hadoop setup and configuration steps.

  • Understand the Hadoop ecosystem, including HDFS, MapReduce, and YARN.

  • Apply queries using Pig, Hive, and Spark.

  • Evaluate Hadoop cluster performance and optimize it.

您将获得的技能

类别:Real Time Data
类别:Apache Kafka
类别:System Design and Implementation
类别:MongoDB
类别:NoSQL
类别:Data Processing
类别:Apache Spark
类别:Distributed Computing
类别:SQL
类别:Scalability
类别:Big Data
类别:Apache Hadoop
类别:Databases
类别:Apache Hive

您将学到什么

  • Design and implement advanced Spark applications tailored to complex data processing needs.

  • Develop and execute Spark scripts to process large datasets and stream real-time data.

  • Compare and optimize Spark algorithms for better performance in big data applications.

  • Assess machine learning models' effectiveness using Spark MLlib for accurate predictions.

您将获得的技能

类别:Apache Spark
类别:Distributed Computing
类别:Scala Programming
类别:Graph Theory
类别:Build Tools
类别:Real Time Data
类别:Data Transformation
类别:IntelliJ IDEA
类别:Data Processing
类别:Development Environment
类别:Big Data
类别:Applied Machine Learning
类别:Regression Analysis
类别:Performance Tuning

您将学到什么

  • Identify key components of the Spark and Scala development environment.

  • Explain the core concepts of Scala and Spark, including Resilient Distributed Datasets (RDDs) and windowing mechanisms.

  • Differentiate between various data integration techniques with Spark Streaming, such as Kafka, Flume, and Cassandra.

  • Assess the performance and reliability of Spark Streaming applications in production environments.

您将获得的技能

类别:Apache Spark
类别:Apache Cassandra
类别:Application Deployment
类别:Apache Kafka
类别:Real Time Data
类别:Development Environment
类别:Applied Machine Learning
类别:Data Processing
类别:Apache Hadoop
类别:Big Data
类别:Scala Programming
类别:Distributed Computing

您将学到什么

  • Explain the architecture and core concepts of Apache Kafka.

  • Set up a personal Kafka development environment.

  • Develop Java applications to produce and consume messages in Kafka.

您将获得的技能

类别:Apache Kafka
类别:Performance Tuning
类别:Command-Line Interface
类别:Java
类别:Apache
类别:Data Pipelines
类别:Enterprise Application Management
类别:Configuration Management
类别:Real Time Data

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

位教师

Packt - Course Instructors
Packt
971 门课程231,340 名学生

提供方

Packt

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.
自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'
Jennifer J.
自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'
Larry W.
自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'
Chaitanya A.
''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'
Coursera Plus

通过 Coursera Plus 开启新生涯

无限制访问 10,000+ 世界一流的课程、实践项目和就业就绪证书课程 - 所有这些都包含在您的订阅中

通过在线学位推动您的职业生涯

获取世界一流大学的学位 - 100% 在线

加入超过 3400 家选择 Coursera for Business 的全球公司

提升员工的技能,使其在数字经济中脱颖而出

常见问题