您好,欢迎访问PDF电子书资源免费下载网

上传文档

当前位置:首页 > PDF图书 > 畅销书 > 小蜜蜂全站 > 大数据架构商业之路:从业务需求到技术方案

大数据架构商业之路:从业务需求到技术方案

二扫码支付 微信
二扫码支付 支付宝

还剩... 页未读,继续阅读

免费阅读已结束,点击付费阅读剩下 ...

¥ 0 元,已有0人购买

免费阅读

阅读已结束,您可以下载文档离线阅读

¥ 1 元,已有0人下载

付费下载
文档简介:

大数据技术丛书 大数据架构商业之路:从业务需求到技术方案 黄申 著 ISBN:978-7-111-53528-7 本书纸版由机械工业出版社于2016年出版,电子版由华章分社(北京华 章图文信息有限公司,北京奥维博世图书发行有限公司)全球范围内制 作与发行。 版权所有,侵权必究 客服热线:+ 86-10-68995265 客服信箱:service@bbbvip.com 官方网址:www.hzmedia.com.cn 新浪微博 @华章数媒 微信公众号 华章电子书(微信号:hzebook) 目录 推荐序一 推荐序二 前言 第1章 抉择 第2章 数据收集 2.1 互联网数据收集 2.1.1 网络爬虫 2.1.2 Apache Nutch简介 2.1.3 Heritrix简介 2.2 内部数据收集 2.2.1 Apache Flume简介 2.2.2 Facebook Scribe和Logstash 2.3 本章心得 2.4 参考资料 第3章 数据存储 3.1 持久化存储 3.1.1 Hadoop和HDFS 3.1.2 HBase简介 3.1.3 MongoDB 3.2 非持久化存储 3.2.1 缓存和散列 3.2.2 Memcached和Berkeley DB简介 3.2.3 Redis简介 3.3 本章心得 3.4 参考资料 第4章 数据处理 4.1 离线批量处理 4.1.1 Hadoop的MapReduce 4.1.2 Spark简介 4.1.3 Hive简介 4.1.4 Pig、Impala和Spark SQL 4.2 提升及时性:消息机制 4.2.1 ActiveMQ简介 4.2.2 Kafka简介 4.3 在线实时处理 4.3.1 Storm简介 4.3.2 Spark Streaming简介 4.4 本章心得 4.5 参考资料 第5章 信息检索 5.1 基本理念 5.2 相关性 5.2.1 布尔模型 5.2.2 基于排序的布尔模型 5.2.3 向量空间模型 5.2.4 语言模型 5.3 及时性 5.4 与数据库查询的对比 5.5 搜索引擎 5.5.1 Web搜索中的链接分析 5.5.2 电子商务中的商品排序 5.5.3 多因素和基于学习的排序 5.5.4 系统框架 5.5.5 Lucene简介 5.5.6 Solr简介 5.5.7 Elasticsearch简介 5.6 推荐系统 5.6.1 推荐的核心要素 5.6.2 推荐系统的分类 5.6.3 混合模型 5.6.4 系统架构 5.6.5 Mahout 5.7 在线广告 5......

资料大王PDF
资料大王PDF
  • 64801

    文档
  • 60.4749

    金币
Ta的主页 发私信

64801篇文档

评论

发表评论
< /0 > 付费下载 ¥ 1 元

Powered by 阿里PDF-免费文档电子书下载

Copyright © PDF电子书资源免费下载网 All Rights Reserved. 皖ICP备2021018472号-4
×
保存成功