安装APP,随时看

您好，欢迎访问PDF电子书资源免费下载网

当前位置：首页 > PDF图书 > 畅销书 > 小蜜蜂全站 > Hadoop数据分析

Hadoop数据分析

资料大王PDF
0 次阅读
0 次下载
2024-09-11 23:25:25

举报
收藏

二扫码支付

微信

赏

二扫码支付

支付宝

还剩... 页未读，继续阅读

免费阅读已结束，点击付费阅读剩下 ... 页

¥ 0 元，已有0人购买

免费阅读

阅读已结束，您可以下载文档离线阅读

¥ 1 元，已有0人下载

付费下载

文档简介：

版权信息书名：Hadoop数据分析作者：[美] Benjamin Bengfort Jenny Kim 译者：王纯超 ISBN：978-7-115-47964-8 本书由北京图灵文化发展有限公司发行数字版。版权所有，侵权必究。您购买的图灵电子书仅供您个人使用，未经授权，不得以任何方式复制和传播本书内容。我们愿意相信读者具有这样的良知和觉悟，与我们共同保护知识产权。如果购买者有侵权行为，我们可能对该用户实施包括但不限于关闭该帐号等维权措施，并可能追究法律责任。图灵社区会员那口虫（wt92328@gmail.com）专享尊重版权版权声明 O'Reilly Media, Inc. 介绍业界评论前言本书目标目标读者阅读方式内容概述编程和示例代码 GitHub仓库执行分布式作业使用示例代码反馈及作者联系方式 Safari® Books Online 联系我们致谢电子书第一部分分布式计算入门第 1 章数据产品时代 1.1 什么是数据产品 1.2 使用Hadoop构建大规模数据产品 1.2.1 利用大型数据集 1.2.2 数据产品中的Hadoop 1.3 数据科学流水线和Hadoop生态系统大数据工作流 1.4 小结第 2 章大数据操作系统 2.1 基本概念 2.2 Hadoop架构 2.2.1 Hadoop集群 2.2.2 HDFS 2.2.3 YARN 2.3 使用分布式文件系统 2.3.1 基本的文件系统操作 2.3.2 HDFS文件权限 2.3.3 其他HDFS接口 2.4 使用分布式计算 2.4.1 MapReduce：函数式编程模型 2.4.2 MapReduce：集群上的实现 2.4.3 不止一个MapReduce：作业链 2.5 向YARN提交MapReduce作业 2.6 小结第 3 章 Python 框架和 Hadoop Streaming 3.1 Hadoop Streaming 3.1.1 使用Streaming在CSV数据上运行计算 3.1.2 执行Streaming作业 3.2 Python的MapReduce框架 3.2.1 短语计数 3.2.2 其他框架 3.3 MapReduce进阶 3.3.1 combiner 3.3.2 partitioner 3.3.3 作业链 3.4 小结第 4 章 Spark 内存计算 4.1 Spark基础 4.1.1 Spark栈 4.1.2 RDD 4.1.3 使用RDD编程 4.2 基于PySpark的交互性Spark ......

资料大王PDF

资料大王PDF

85475
文档
104.925
金币

Ta的主页发私信

共85475篇文档

相关文档

Hadoop数据分析 0

相关搜索

Hadoop数据分析

评论

发表评论

< /0 > 付费下载 ¥ 1 元

扫描二维码
关注官方微信

联系我们

电话 : 18700007324

邮箱 : 1184733552@qq.com

Q Q : 1184733552

地址 : 安徽省滁州市南谯区

Powered by 阿里PDF-免费文档电子书下载

Copyright © PDF电子书资源免费下载网 All Rights Reserved. 皖ICP备2021018472号-4

保存成功