Spark内核设计的艺术:架构设计与实现
- 资料大王PDF
-
0 次阅读
-
0 次下载
-
2024-10-26 20:15:16
微信
赏
支付宝
文档简介:
大数据技术丛书
Spark内核设计的艺术:架构设计与实现
耿嘉安 著
ISBN:978-7-111-58439-1
本书纸版由机械工业出版社于2017年出版,电子版由华章分社(北京华
章图文信息有限公司,北京奥维博世图书发行有限公司)全球范围内制
作与发行。
版权所有,侵权必究
客服热线:+ 86-10-68995265
客服信箱:service@bbbvip.com
官方网址:www.hzmedia.com.cn
新浪微博 @华章数媒
微信公众号 华章电子书(微信号:hzebook)
目录
本书赞誉
前言
第1章 环境准备
1.1 运行环境准备
1.1.1 安装JDK
1.1.2 安装Scala
1.1.3 安装Spark
1.2 Spark初体验
1.2.1 运行spark-shell
1.2.2 执行word count
1.2.3 剖析spark-shell
1.3 阅读环境准备
1.3.1 安装SBT
1.3.2 安装Git
1.3.3 安装Eclipse Scala IDE插件
1.4 Spark源码编译与调试
1.5 小结
第2章 设计理念与基本架构
2.1 初识Spark
2.1.1 Hadoop MRv1的局限
2.1.2 Spark的特点
2.1.3 Spark使用场景
2.2 Spark基础知识
2.3 Spark基本设计思想
2.3.1 Spark模块设计
2.3.2 Spark模型设计
2.4 Spark基本架构
2.5 小结
第3章 Spark基础设施
3.1 Spark配置
3.1.1 系统属性中的配置
3.1.2 使用SparkConf配置的API
3.1.3 克隆SparkConf配置
3.2 Spark内置RPC框架
3.2.1 RPC配置TransportConf
3.2.2 RPC客户端工厂TransportClientFactory
3.2.3 RPC服务端TransportServer
3.2.4 管道初始化
3.2.5 TransportChannelHandler详解
3.2.6 服务端RpcHandler详解
3.2.7 服务端引导程序TransportServerBootstrap
3.2.8 客户端TransportClient详解
3.3 事件总线
3.3.1 ListenerBus的继承体系
3.3.2 SparkListenerBus详解
3.3.3 LiveListenerBus详解
3.4 度量系统
3.4.1 Source继承体系
3.4.2 Sink继承体系
3.5 小结
第4章 SparkContext的初始化
4.1 SparkCon......
评论
发表评论