您好,欢迎访问PDF电子书资源免费下载网

上传文档

当前位置:首页 > PDF图书 > 畅销书 > 小蜜蜂全站 > Spark技术内幕:深入解析Spark内核架构设计与实现原理

Spark技术内幕:深入解析Spark内核架构设计与实现原理

二扫码支付 微信
二扫码支付 支付宝

还剩... 页未读,继续阅读

免费阅读已结束,点击付费阅读剩下 ...

¥ 0 元,已有0人购买

免费阅读

阅读已结束,您可以下载文档离线阅读

¥ 1 元,已有0人下载

付费下载
文档简介:

大数据技术丛书 Spark技术内幕:深入解析Spark内核架构设计与实 现原理 张安站 著 ISBN:978-7-111-50964-6 本书纸版由机械工业出版社于2015年出版,电子版由华章分社(北京华 章图文信息有限公司,北京奥维博世图书发行有限公司)全球范围内制 作与发行。 版权所有,侵权必究 客服热线:+ 86-10-68995265 客服信箱:service@bbbvip.com 官方网址:www.hzmedia.com.cn 新浪微博 @华章数媒 腾讯微博 @yanfabook 微信公众号 华章电子书(微信号:hzebook) 目录 序 前言 第1章 Spark简介 1.1 Spark的技术背景 1.2 Spark的优点 1.3 Spark架构综述 1.4 Spark核心组件概述 1.4.1 Spark Streaming 1.4.2 MLlib 1.4.3 Spark SQL 1.4.4 GraphX 1.5 Spark的整体代码结构规模 第2章 Spark学习环境的搭建 2.1 源码的获取与编译 2.1.1 源码获取 2.1.2 源码编译 2.2 构建Spark的源码阅读环境 2.3 小结 第3章 RDD实现详解 3.1 概述 3.2 什么是RDD 3.2.1 RDD的创建 3.2.2 RDD的转换 3.2.3 RDD的动作 3.2.4 RDD的缓存 3.2.5 RDD的检查点 3.3 RDD的转换和DAG的生成 3.3.1 RDD的依赖关系 3.3.2 DAG的生成 3.3.3 Word Count的RDD转换和DAG划分的逻辑视图 3.4 RDD的计算 3.4.1 Task简介 3.4.2 Task的执行起点 3.4.3 缓存的处理 3.4.4 checkpoint的处理 3.4.5 RDD的计算逻辑 3.5 RDD的容错机制 3.6 小结 第4章 Scheduler模块详解 4.1 模块概述 4.1.1 整体架构 4.1.2 Scheduler的实现概述 4.2 DAGScheduler实现详解 4.2.1 DAGScheduler的创建 4.2.2 Job的提交 4.2.3 Stage的划分 4.2.4 任务的生成 4.3 任务调度实现详解 4.3.1 TaskScheduler的创建 4.3.2 Task的提交概述 4.3.3 任务调度具体实现 4.3.4 Task运算结果的处理 4.4 Word Count调度计算过程详解 4.5 小结 第5章 Deploy模块详解 5.1 Spark运行模式概述 5.1.1 ......

资料大王PDF
资料大王PDF
  • 86086

    文档
  • 170.275

    金币
Ta的主页 发私信

86086篇文档

评论

发表评论
< /0 > 付费下载 ¥ 1 元

Powered by 阿里PDF-免费文档电子书下载

Copyright © PDF电子书资源免费下载网 All Rights Reserved. 皖ICP备2021018472号-4
×
保存成功