Hadoop技术内幕:深入解析HadoopCommon和HDFS架构设计与实现原.epub
- 资料大王PDF
-
0 次阅读
-
0 次下载
-
2024-10-21 20:51:49
微信
赏
支付宝
文档简介:
Hadoop技术内幕
——深入解析Hadoop Common和HDFS架构设计与实现原理
蔡斌 陈湘萍 著
ISBN:978-7-111-41766-8
本书纸版由机械工业出版社于2013年出版,电子版由华章分社(北京华
章图文信息有限公司)全球范围内制作与发行。
版权所有,侵权必究
客服热线:+ 86-10-68995265
客服信箱:service@bbbvip.com
官方网址:www.hzmedia.com.cn
新浪微博 @研发书局
腾讯微博 @yanfabook
目录
前言
为什么写本书
读者对象
本书的主要内容
勘误和支持
致谢
第一部分 环境准备
第1章 源代码环境准备
1.1 什么是Hadoop
1.2 准备源代码阅读环境
1.3 准备Hadoop源代码
1.4 小结
第二部分 Common的实现
第2章 Hadoop配置信息处理
2.1 配置文件简介
2.2 Hadoop Configuration详解
2.3 Configurable接口
2.4 小结
第3章 序列化与压缩
前言
为什么写本书
互联网使得信息的采集、传播速度和规模达到空前的水平,实现了
全球的信息共享与交互,它已经成为信息社会必不可少的基础设施,同
时也带来了多方面的新挑战。2003年,Google发表了《Google File
System》,介绍了Google海量数据处理使用的文件系统,使互联网时代
的数据存储发生了革命性的变化。而Doug Cutting等人在Nutch项目上应
用GFS和MapReduce思想,并演化为Hadoop项目,经过多年的发展,最
终形成了包含多个相关项目的软件生态系统,开创了海量数据处理的新
局面。
Hadoop正是为了解决互联网时代的海量数据存储和处理而设计、开
发的。简单地讲,Hadoop是一个可以更容易开发和并行处理大规模数据
的分布式计算平台,它的主要特点是:扩展能力强、成本低、高效率、
可靠。目前,Hadoop的用户已经从传统的互联网公司,扩展到科学计
算、电信行业、电力行业、生物行业以及金融公司,并得到越来越广泛
的应用。
Hadoop作为一个优秀的开源项目,提供了一些文档和所有的源代
码,但是,对于很多开发人员,仅仅通过一些简单的例子或教程学习使
用Hadoop的基本功能是远远不够的。同时,随着云计算和大数据的发
展,产业界正在经历一次重大变革,特别是基于云计算的海量数据处
理,改变着我们思考的方式和习惯,开发者们越来越有必要去了解
Hadoop的架构与设计原理。
本书从源代码的层面上对Hadoop的公共工具Common和Hadoop的分......
评论
发表评论