您好,欢迎访问PDF电子书资源免费下载网

上传文档

当前位置:首页 > PDF图书 > 畅销书 > 小蜜蜂全站 > PentahoKettle解决方案_使用PDI构建开源ETL解决方案

PentahoKettle解决方案_使用PDI构建开源ETL解决方案

二扫码支付 微信
二扫码支付 支付宝

还剩... 页未读,继续阅读

免费阅读已结束,点击付费阅读剩下 ...

¥ 0 元,已有0人购买

免费阅读

阅读已结束,您可以下载文档离线阅读

¥ 1 元,已有0人下载

付费下载
文档简介:

内容简介 本书主要介绍如何使用开源ETL工具来完成数据整合工作。 本书介绍的PDI(Kettle)是一种开源的ETL解决方案,书中介绍了 如何使用PDI来实现数据的剖析、清洗、校验、抽取、转换、加载等各 类常见的ETL类工作。 除了ODS/DW类比较大型的应用外,Kettle实际还可以为中小企业 提供灵活的数据抽取和数据处理的功能。Kettle除了支持各种关系型数 据库、HBase、MongoDB这样的NoSQL数据源外,它还支持Excel、 Access这类小型的数据源。并且通过插件扩展,Kettle可以支持各类数 据源。本书详细介绍了Kettle可以处理的数据源,而且详细介绍了如何 使用Kettle抽取增量数据。 Kettle的数据处理功能也很强大,除了选择、过滤、分组、连接、 排序这些常用的功能外,Kettle里的Java表达式、正则表达式、Java脚 本、Java类等功能都非常灵活而强大,都非常适合于各种数据处理功 能。本书也使用了一些篇幅介绍Kettle这些灵活的数据处理功能。 本书后面章节介绍了如何在Kettle上开发插件,如何使用Kettle处理 实时数据流,以及如何在Amazon AWS上运行Kettle等一些高级主题。 除了介绍PDI(Kettle)工具的使用和功能,本书还结合Kimball博 士的数据仓库和ETL子系统的理论,从实践的角度介绍数据仓库的模型 设计、数据仓库的构建方法,以及如何使用PDI实现Kimball博士提出的 34种ETL子系统。 Pentaho Kettle Solutions: Building Open Source ETL Solutions with Pentaho Data Integration ISBN:9780470635179 Original English Edition Copyright © 2010 by Wiley Publishing, Inc. All rights reserved. This translation published under license. Authorized Translation of the Edition published by Wiley Publishing, Inc. Indianapolis, Indiana. No part of this book may be reproduced in any form without the written permission of Wiley Publishing, Inc. Copies of this book sold without a Wil......

资料大王PDF
资料大王PDF
  • 85346

    文档
  • 87.825

    金币
Ta的主页 发私信

85346篇文档

评论

发表评论
< /0 > 付费下载 ¥ 1 元

Powered by 阿里PDF-免费文档电子书下载

Copyright © PDF电子书资源免费下载网 All Rights Reserved. 皖ICP备2021018472号-4
×
保存成功