本人从13年开始接触大数据，也算在大数据领域中摸爬滚打了很多年，本项目是我对大数据行业相关技术做些梳理。

1、Hadoop

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

2、Spark

Spark是基于内存计算的大数据并行计算框架，可用于构建大型的、低延迟的数据分析应用程序

Apache Flink是由Apache软件基金会开发的开源流处理框架，其核心是用Java和Scala编写的分布式流数据流引擎。
Flink以数据并行和流水线方式执行任意流数据程序，Flink的流水线运行时系统可以执行批处理和流处理程序。