极客时间已完结课程限时免费阅读

大规模数据处理实战

Apr 15, 2019

开篇词 | 从这里开始，带你走上硅谷一线系统架构师之路

01 | 为什么MapReduce会被硅谷一线公司淘汰？

02 | MapReduce后谁主沉浮：怎样设计下一代数据处理技术？

03 | 大规模数据处理初体验：怎样实现大型电商热销榜？

04 | 分布式系统（上）：学会用服务等级协议SLA来评估你的系统

05 | 分布式系统（下）：架构师不得不知的三大指标

06 | 如何区分批处理还是流处理？

07 | Workflow设计模式：让你在大规模数据世界中君临天下

08 | 发布/订阅模式：流处理架构中的瑞士军刀

09 | CAP定理：三选二，架构师必须学会的取舍

10 | Lambda架构：Twitter亿级实时数据分析架构背后的倚天剑

11 | Kappa架构：利用Kafka锻造的屠龙刀

12 | 我们为什么需要Spark？

13 | 弹性分布式数据集：Spark大厦的地基（上）

14 | 弹性分布式数据集：Spark大厦的地基（下）

15 | Spark SQL：Spark数据查询的利器

16 | Spark Streaming：Spark的实时流计算API

17 | Structured Streaming：如何用DataFrame API进行实时数据分析?

18 | Word Count：从零开始运行你的第一个Spark应用

19 | 综合案例实战：处理加州房屋信息，构建线性回归模型

20 | 流处理案例实战：分析纽约市出租车载客信息

21 | 深入对比Spark与Flink：帮你系统设计两开花

22 | Apache Beam的前世今生

23 | 站在Google的肩膀上学习Beam编程模型

24 | PCollection：为什么Beam要如此抽象封装数据？

25 | Transform：Beam数据转换操作的抽象方法

26 | Pipeline：Beam如何抽象多步骤的数据流水线？

27 | Pipeline I/O: Beam数据中转的设计模式

28 | 如何设计创建好一个Beam Pipeline？

29 | 如何测试Beam Pipeline？

30 | Apache Beam实战冲刺：Beam如何run everywhere?

31 | WordCount Beam Pipeline实战

32 | Beam Window：打通流处理的任督二脉

33 | 横看成岭侧成峰：再战Streaming WordCount

34 | Amazon热销榜Beam Pipeline实战

35 | Facebook游戏实时流处理Beam Pipeline实战（上）

36 | Facebook游戏实时流处理Beam Pipeline实战（下）

37 | 5G时代，如何处理超大规模物联网数据

38 | 大规模数据处理在深度学习中如何应用？

39 | 从SQL到Streaming SQL：突破静态数据查询的次元

40 | 大规模数据处理未来之路

FAQ第一期 | 学习大规模数据处理需要什么基础？

加油站 | Practice makes perfect！

FAQ第二期 | Spark案例实战答疑

FAQ第三期 | Apache Beam基础答疑

结束语 | 世间所有的相遇，都是久别重逢