Python数据挖掘入门与实践
- 资料大王PDF
-
0 次阅读
-
0 次下载
-
2024-04-16 20:30:19
微信
赏
支付宝
文档简介:
版权信息
书名:Python数据挖掘入门与实践
作者:[澳] Robert Layton
译者:杜春晓
ISBN:978-7-115-42710-6
本书由北京图灵文化发展有限公司发行数字版。版权所有,侵权必
究。
您购买的图灵电子书仅供您个人使用,未经授权,不得以任何方式复制
和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐
号等维权措施,并可能追究法律责任。
图灵社区会员 憨豆战神(vikecom@163.com) 专享 尊重版权
版权声明
译者序
前言
本书主要内容
本书的阅读前提
本书的目标读者
排版约定
读者反馈
客户支持
下载示例代码
下载配套PDF文件
勘误表
侵权
问题
第 1 章 开始数据挖掘之旅
1.1 数据挖掘简介
1.2 使用Python和IPython Notebook
1.2.1 安装Python
1.2.2 安装IPython
1.2.3 安装scikit-learn库
1.3 亲和性分析示例
1.3.1 什么是亲和性分析
1.3.2 商品推荐
1.3.3 在NumPy中加载数据集
1.3.4 实现简单的排序规则
1.3.5 排序找出最佳规则
1.4 分类问题的简单示例
1.5 什么是分类
1.5.1 准备数据集
1.5.2 实现OneR算法
1.5.3 测试算法
1.6 小结
第 2 章 用scikit-learn估计器分类
2.1 scikit-learn估计器
2.1.1 近邻算法
2.1.2 距离度量
2.1.3 加载数据集
2.1.4 努力实现流程标准化
2.1.5 运行算法
2.1.6 设置参数
2.2 流水线在预处理中的应用
2.2.1 预处理示例
2.2.2 标准预处理
2.2.3 组装起来
2.3 流水线
2.4 小结
第 3 章 用决策树预测获胜球队
3.1 加载数据集
3.1.1 采集数据
3.1.2 用pandas加载数据集
3.1.3 数据集清洗
3.1.4 提取新特征
3.2 决策树
3.2.1 决策树中的参数
3.2.2 使用决策树
3.3 NBA比赛结果预测
组装起来
3.4 随机森林
3.4.1 决策树的集成效果如何
3.4.2 随机森林算法的参数
3.4.3 使用随机森林算法
3.4.4 创建新特征
3.5 小结
第 4 章 用亲和性分析方法推荐电影
4.1 亲和性分析
4.1.1 亲和性分析算法
4.1.2 选择参数
4.2 电影推荐问题
4.2.1 获取数据集
......
评论
发表评论