Spark大数据分析实战
- 资料大王PDF
-
0 次阅读
-
0 次下载
-
2024-06-18 20:33:05
微信
赏
支付宝
文档简介:
大数据技术丛书
Spark大数据分析实战
高彦杰 倪亚宇 著
译者 译
ISBN:978-7-111-52307-9
本书纸版由机械工业出版社于2015年出版,电子版由华章分社(北京华
章图文信息有限公司,北京奥维博世图书发行有限公司)全球范围内制
作与发行。
版权所有,侵权必究
客服热线:+ 86-10-68995265
客服信箱:service@bbbvip.com
官方网址:www.hzmedia.com.cn
新浪微博 @华章数媒
微信公众号 华章电子书(微信号:hzebook)
目录
前言
第1章 Spark简介
1.1 初识Spark
1.2 Spark生态系统BDAS
1.3 Spark架构与运行逻辑
1.4 弹性分布式数据集
1.4.1 RDD简介
1.4.2 RDD算子分类
1.5 本章小结
第2章 Spark开发与环境配置
2.1 Spark应用开发环境配置
2.1.1 使用Intellij开发Spark程序
2.1.2 使用SparkShell进行交互式数据分析
2.2 远程调试Spark程序
2.3 Spark编译
2.4 配置Spark源码阅读环境
2.5 本章小结
第3章 BDAS简介
3.1 SQL on Spark
3.1.1 为什么使用Spark SQL
3.1.2 Spark SQL架构分析
3.2 Spark Streaming
3.2.1 Spark Streaming简介
3.2.2 Spark Streaming架构
3.2.3 Spark Streaming原理剖析
3.3 GraphX
3.3.1 GraphX简介
3.3.2 GraphX的使用简介
3.3.3 GraphX体系结构
3.4 MLlib
3.4.1 MLlib简介
3.4.2 MLlib中的聚类和分类
3.5 本章小结
第4章 Lamda架构日志分析流水线
4.1 日志分析概述
4.2 日志分析指标
4.3 Lamda架构
4.4 构建日志分析数据流水线
4.4.1 用Flume进行日志采集
4.4.2 用Kafka将日志汇总
4.4.3 用Spark Streaming进行实时日志分析
4.4.4 Spark SQL离线日志分析
4.4.5 用Flask将日志KPI可视化
4.5 本章小结
第5章 基于云平台和用户日志的推荐系统
5.1 Azure云平台简介
5.1.1 Azure网站模型
5.1.2 Azure数据存储
5.1.3 Azure Queue消息传递
5.2 系统架构
5.3 构建Node.js应用
5.3.1 创建Az......
评论
发表评论