您好,欢迎访问PDF电子书资源免费下载网

上传文档

当前位置:首页 > 专业书籍 > 计算机类 > 其他 > Spark核心技术与高级应用.html

Spark核心技术与高级应用.html

二扫码支付 微信
二扫码支付 支付宝

还剩... 页未读,继续阅读

免费阅读已结束,点击付费阅读剩下 ...

¥ 0 元,已有0人购买

免费阅读

阅读已结束,您可以下载文档离线阅读

¥ 1 元,已有0人下载

付费下载
文档简介:

前言 上善若水,水善利万物而不争。 数据一如水,无色无味,非方非圆,以百态存于自然,于自然无违也。绵绵密密,微则无声,巨则汹涌;与人无争却又容纳万物。 生活离不开水,同样离不开数据,我们被数据包围,在数据中生活,在数据中入梦和清醒。 某夜入梦时分,趴桌而眠,偶遇庄周那只彩色翅膀的蝴蝶飞入梦中,在数据上翩翩起舞;清醒时分,蝴蝶化身数据,继续在眼前飞舞,顿悟大数据之哲学。本书从《道德经》和《庄子》各精选10句名 言,并结合大数据相关内容,对名言加以讲解,引导大家以老庄的思考方式来认识大数据的内涵,探求老子道之路和庄子智慧之路。 为什么要写这本书 2014年春天,我所在的知识云团队聚焦大数据,调研过程中,深深感觉到国内资料匮乏,可供参考的资料仅是Spark官方文档。团队人员英文水平参差不齐,Spark官方文档门槛比较高,学习起来困难 重重。 当时和几个同事一起,对Spark官方文档进行了翻译,参考了机械工业出版社《Spark快速数据处理》的小册子,编了一本《Spark数据处理》内部文档,解决了一部分问题,并将Spark应用推向具体 业务。在实际业务中,相比传统的数据处理,尤其是实时处理和迭代计算,MapReduce在Spark面前显得苍白无力。随着Spark的应用越来越多,深深感觉到《Spark数据处理》内部文档的不足,遗憾的 是,一直没有时间进行补充和完善,俨然成了一块心病。 2014年9月,在机械工业出版社华章公司福川兄的指导下,开始重点思索:Spark解决哪些问题、优势在哪里、从业人员遇到哪些困难、如何解决这些困难等问题,并得到了吴爱华、吕劲松、代其锋、 马海平、向海、陈明磊等几位同事的支持。怀着一颗“附庸风雅”之心,我决定和大家一起写一本具有一定实战价值的Spark方面的书籍。 当前大数据从业者,有数据科学家、算法专家、来自互联网的程序员、来自传统行业的工程师等,无论来自哪里,作为新一代轻量级计算框架,Spark集成Spark SQL、Spark Streaming、MLlib、 GraphX、SparkR等子框架,都提供了一种全新的大数据处理方式,让从业者的工作变得越来越便捷,也让机器学习、数据挖掘等算法变得“接地气”。数据科学家和算法专家越来越了解社会,程序员和 工程师有了逆袭的机会。 本书写作过程中,Spark版本从1.0一直变化到1.5,秉承大道至简的主导思想,我们尽可能地按照1.5版本进行了统筹,希望能抛砖引玉,以个人的一些想法和见解,为读者拓展出更深入、更全面的思 路。 本书只是一个开始,大数据之漫漫雄关,还需要迈步从头越。 本书特色 本书虽是大数据相关书籍,但对传统文化进行了一次缅怀,吸收传统文化的精华,精选了《道德经》和......

资料大王PDF
资料大王PDF
  • 85346

    文档
  • 88.825

    金币
Ta的主页 发私信

85346篇文档

评论

发表评论
< /0 > 付费下载 ¥ 1 元

Powered by 阿里PDF-免费文档电子书下载

Copyright © PDF电子书资源免费下载网 All Rights Reserved. 皖ICP备2021018472号-4
×
保存成功