BigDataGuide
大数据学习,从零开始学习大数据,包含大数据学习各阶段学习视频、面试资料
Install / Use
/learn @MoRan1607/BigDataGuideREADME
大数据学习指南
大数据学习指南,从零开始学习大数据开发,包含大数据学习各个阶段资汇总
公众号
关注我的公众号:旧时光大数据,回复相应关键字,获取更多大数据干货、资料<br>
“大数据学习路线”中我自己看过的视频、文档资料可以直接在公众号获取云盘链接
《大数据面试题 V6.0》已出,公众号回复:大数据面试题
<p align="center"> <img src="https://github.com/MoRan1607/BigDataGuide/blob/master/Pics/%E5%85%AC%E4%BC%97%E5%8F%B7%E4%BA%8C%E7%BB%B4%E7%A0%81.jpg" width="200" height="200"/> <p align="center"> </p> </p>知识星球
知识星球内容包括学习路线、学习资料(根据编程语言(Java、Python、Java+Scala)分了三大版本)、项目(50+个大数据项目)、面试题(1930+道真实大数据面试题、Java基础、计算机网络、Redis、ClickHouse、Elasticsearch)、1200+篇大数据真实面经、600+篇Java后端真实面经(已按公司分类)、自己整理的视频学习笔记
新增:230道Hadoop、Zookeeper、Hive、Flume、Kafka、HBase、Spark、Flink、数仓和综合部分(一些框架组件比对相关的题目)面试题
<p align="center"> <img src="https://github.com/MoRan1607/BigDataGuide/blob/master/Pics/%E7%9F%A5%E8%AF%86%E6%98%9F%E7%90%83%E4%BC%98%E6%83%A0%E5%88%B8-2026%E5%B9%B41%E6%9C%8820%E6%97%A5.png" width="300" height="387"/> <p align="center"> </p> </p>概述
大数据学习路线
学习路线中的视频、文档资料可以关注公众号:旧时光大数据,回复相应关键字获取云盘链接
编程语言
编程语言部分建议先JavaSE,Spark和Flink之前学习Scala,如果时间紧迫,就找个Java版的Spark或Flink教程,Python看个人或工作,不过有Java基础,Python会快很多(别问我怎么学,问就是使劲拼命学 [ 吃瓜.jpg ])
一、JavaSE(三选一)
二、Scala(二选一)
如果时间短,建议直接看配套Spark的那种三五天的,可以快速了解
三、Python
推荐黑马的Python视频,通俗易懂,而且文档比较齐全,有Java基础再看Python的话,上手很快
Linux
关于VM、远程登录工具的安装暂时可以参考我的博客,找到相应步骤进行操作即可
大数据框架组件
一、Hadoop
1. Hadoop——分布式文件管理系统HDFS
2. Hadoop——HDFS的Shell操作
3. Hadoop——HDFS的Java API操作
4. Hadoop——分布式计算框架MapReduce
5. Hadoop——MapReduce案例
6. Hadoop——资源调度器YARN
7. Hadoop——Hadoop数据压缩
二、Zookeeper
1.Zookeeper——Zookeeper概述
2.Zookeeper——Zookeeper单机和分布式安装
3.Zookeeper——Zookeeper客户端命令
4.Zookeeper——Zookeeper内部原理
5.Zookeeper——Zookeeper实战
三、Hive
1.Hive——Hive概述
2.Hive——Hive数据类型
3.Hive——Hive DDL数据定义
4.Hive——Hive DML数据操作
5.Hive——Hive查询
6.Hive——Hive函数
7.Hive——Hive压缩和存储
8.Hive——Hive实战:统计影音视频网站的常规指标
9.Hive——Hive分区表和分桶表
10.Hive——Hive调优
四、Flume
1.Flume——Flume概述
2.Flume——Flume实践操作
3.Flume——Flume案例
五、Kafka
1.Kafka——Kafka概述
2.Kafka——Kafka深入解析
3.Kafka——Kafka API操作实践
3.Kafka——Kafka对接Flume实践
六、HBase
1.HBase——HBase概述
2.HBase——HBase数据结构
3.HBase——HBase Shell操作
4.HBase——HBase API实践操作
七、Spark
Spark基础
1.Spark基础——Spark的诞生
2.Spark基础——Spark概述
3.Spark基础——Spark运行模式
4.Spark基础——案例实践
Spark Core
1.Spark Core——RDD概述
2.Spark Core——RDD编程(一)
3.Spark Core——RDD编程(二)
4.Spark Core——键值对RDD数据分区器
5.Spark Core——数据读取与保存
Spark SQL
1.Spark SQL——Spaek SQL概述
2.Spark SQL——Spaek SQL编程
3.Spark SQL——Spaek SQL数据的加载与保存
4.Spark SQL——Spaek SQL实战
Spark Streaming
1.[Spark Streaming——Spark Streaming概述](https://github.com/Dr11ft/BigDataGuide/blob/master/Spark/Spark%20Streaming/1%E3%80%81Spark%20Streami
Related Skills
node-connect
340.5kDiagnose OpenClaw node connection and pairing failures for Android, iOS, and macOS companion apps
frontend-design
84.2kCreate distinctive, production-grade frontend interfaces with high design quality. Use this skill when the user asks to build web components, pages, or applications. Generates creative, polished code that avoids generic AI aesthetics.
openai-whisper-api
340.5kTranscribe audio via OpenAI Audio Transcriptions API (Whisper).
commit-push-pr
84.2kCommit, push, and open a PR
Security Score
Audited on Mar 27, 2026
