机器学习系统设计 (图灵程序设计丛书)
- 资料大王PDF
-
0 次阅读
-
0 次下载
-
2024-11-12 21:42:36
微信
赏
支付宝
文档简介:
版权信息
书名:机器学习系统设计
作者:Willi Richert, Luis Pedro Coelho
译者:刘峰
ISBN:978-7-115-35682-6
本书由北京图灵文化发展有限公司发行数字版。版权所有,侵权必
究。
您购买的图灵电子书仅供您个人使用,未经授权,不得以任何方式复制
和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐
号等维权措施,并可能追究法律责任。
目录
版权声明
译者序
作者致谢
关于作者
关于审校者
前言
第1章 Python机器学习入门
1.1 梦之队:机器学习与Python
1.2 这本书将教给你什么(以及不会教什么)
1.3 遇到困难的时候怎么办
1.4 开始
1.4.1 NumPy、SciPy和Matplotlib简介
1.4.2 安装Python
1.4.3 使用NumPy和SciPy智能高效地处理数据
1.4.4 学习NumPy
1.4.5 学习SciPy
1.5 我们第一个(极小的)机器学习应用
1.5.1 读取数据
1.5.2 预处理和清洗数据
1.5.3 选择正确的模型和学习算法
1.6 小结
第2章 如何对真实样本分类
2.1 Iris数据集
2.1.1 第一步是可视化
2.1.2 构建第一个分类模型
2.2 构建更复杂的分类器
2.3 更复杂的数据集和更复杂的分类器
2.3.1 从Seeds数据集中学习
2.3.2 特征和特征工程
2.3.3 最邻近分类
2.4 二分类和多分类
2.5 小结
第3章 聚类:寻找相关的帖子
3.1 评估帖子的关联性
3.1.1 不应该怎样
3.1.2 应该怎样
3.2 预处理:用相近的公共词语个数来衡量相似性
3.2.1 将原始文本转化为词袋
3.2.2 统计词语
3.2.3 词语频次向量的归一化
3.2.4 删除不重要的词语
3.2.5 词干处理
3.2.6 停用词兴奋剂
3.2.7 我们的成果和目标
3.3 聚类
3.3.1 K均值
3.3.2 让测试数据评估我们的想法
3.3.3 对帖子聚类
3.4 解决我们最初的难题
换个角度看噪声
3.5 调整参数
3.6 小结
第4章 主题模型
4.1 潜在狄利克雷分配(LDA)
构建主题模型
4.2 在主题空间比较相似度
对整个维基百科建模
4.3 选择主题个数
4.4 小结
第5章 分类:检测劣质答案
5.1 路线图概述
5.2 学习如何区分出优秀的答案
5.2.1 调整样本
5.2.2 调整分类器
5.3 获取数据
5.3.1 将数据消减到可处理的程度
5.3.2 对......
评论
发表评论