Python数据挖掘:概念、方法与实践
- 资料大王PDF
-
0 次阅读
-
0 次下载
-
2024-08-31 13:27:39
微信
赏
支付宝
文档简介:
数据分析与决策技术丛书
Python数据挖掘:概念、方法与实践
Mastering Data Mining with Python-Find patterns
hidden in your data
(美)梅甘·斯夸尔(Megan Squire) 著
姚军 译
ISBN:978-7-111-56548-2
本书纸版由机械工业出版社于2017年出版,电子版由华章分社(北京华
章图文信息有限公司,北京奥维博世图书发行有限公司)全球范围内制
作与发行。
版权所有,侵权必究
客服热线:+ 86-10-68995265
客服信箱:service@bbbvip.com
官方网址:www.hzmedia.com.cn
新浪微博 @华章数媒
微信公众号 华章电子书(微信号:hzebook)
目录
译者序
关于审稿人
前言
第1章 扩展你的数据挖掘工具箱
1.1 什么是数据挖掘
1.2 如何进行数据挖掘
1.2.1 Fayyad等人的KDD过程
1.2.2 韩家炜等人的KDD过程
1.2.3 CRISP-DM过程
1.2.4 六步过程
1.2.5 哪一种数据挖掘方法最好
1.3 在数据挖掘中使用哪些技术
1.4 如何建立数据挖掘工作环境
1.5 小结
第2章 关联规则挖掘
2.1 什么是频繁项集
2.1.1 都市传奇“尿布与啤酒”
2.1.2 频繁项集挖掘基础知识
2.2 迈向关联规则
2.2.1 支持度
2.2.2 置信度
2.2.3 关联规则
2.2.4 包含数据的示例
2.2.5 附加值——修复计划中的漏洞
2.2.6 寻找频繁项集的方法
2.3 项目——发现软件项目标签中的关联规则
2.4 小结
第3章 实体匹配
3.1 什么是实体匹配
3.1.1 数据合并
3.1.2 匹配技术
3.1.3 基于属性的相似度匹配
3.1.4 属性匹配方法
3.1.5 利用不相交数据集
3.1.6 基于上下文的相似度匹配
3.1.7 基于机器学习的实体匹配
3.1.8 实体匹配技术的评估
3.2 实体匹配项目
3.2.1 软件项目匹配的难度
3.2.2 两个例子
3.2.3 根据项目名称匹配
3.2.4 根据人名匹配
3.2.5 根据URL匹配
3.2.6 按照主题和描述关键词匹配
3.2.7 数据集
3.2.8 代码
3.2.9 结果
3.3 小结
第4章 网络分析
4.1 什么是网络
4.2 网络计量
4.2.1 网络的度数
4.2.2 网络直径
4.2.3 网络中的通路、路径和迹
4.2.4 网络的成分
4.2.5 图的中心性
4.3 图数据的表示
4.3......
评论
发表评论