MapReduce设计模式
- 资料大王PDF
-
0 次阅读
-
0 次下载
-
2024-11-05 22:39:54
微信
赏
支付宝
文档简介:
目 录
版权信息
内容提要
版权声明
O'Reilly Media,Inc.介绍
译者序
前言
第1章 设计模式与MapReduce
1.1 设计模式
1.2 MapReduce简史
1.3 MapReduce和Hadoop简介
1.4 Hadoop示例:单词计数
1.5 Pig和Hive
第2章 概要模式
2.1 数值概要
2.1.1 模式描述
2.1.2 数值概要示例
2.2 倒排索引概要
2.2.1 模式描述
2.2.2 倒排索引示例
2.3 计数器计数
2.3.1 模式描述
2.3.2 计数器计数示例
第3章 过滤模式
3.1 过滤
3.1.1 模式描述
3.1.2 过滤示例
3.2 布隆过滤
3.2.1 模式描述
3.2.2 布隆过滤器示例
3.3 Top 10
3.3.1 模式描述
3.3.2 Top 10示例
3.4 去重
3.4.1 模式描述
3.4.2 去重示例
第4章 数据组织模式
4.1 分层结构
4.1.1 模式描述
4.1.2 分层结构示例
4.2 分区
4.2.1 模式描述
4.2.2 分区示例
4.3 分箱
4.3.1 模式描述
4.3.2 分箱示例
4.4 全排序
4.4.1 模式描述
4.4.2 全排序示例
4.5 混排
4.5.1 模式描述
4.5.2 混排示例
第5章 连接模式
5.1 连接简介
5.2 reduce端连接
5.2.1 模式描述
5.2.2 reduce端连接示例
5.2.3 使用布隆过滤器的reduce端连接
5.3 复制连接
5.3.1 模式描述
5.3.2 复制连接示例
5.4 组合连接
5.4.1 模式描述
5.4.2 组合连接示例
5.5 笛卡儿积
5.5.1 模式描述
5.5.2 笛卡儿积示例
第6章 元模式
6.1 作业链
6.1.1 关于驱动程序
6.1.2 作业链示例
6.1.3 关于shell脚本
6.1.4 关于JobControl
6.2 链折叠
6.2.1 ChainMapper方法和ChainReducer方法
6.2.2 链折叠示例
6.3 作业归并
作业归并示例
第7章 输入和输出模式
7.1 在Hadoop中自定义输入和输出
7.1.1 InputFormat
7.1.2 RecordReader
7.1.3 OutputFormat
7.1.4 RecordWriter
7.2 生成数据
7.2.1 模式描述
7.2.2 生成数据示例
7.3 外部源输出
7.3.1 模式描述
7.3.2 外部源输出示例
7.4 外部源输入
7.4.1 模型描述
7.4.2 外部源输入示例
7.5 分区裁剪
7.5.1 模式描述
7.5.2 分区裁剪示例
第8章 最后的思考与设计模式的未来
8.1......
评论
发表评论