《Python 3爬虫、数据清洗与可视化实战》
- 资料大王PDF
-
0 次阅读
-
0 次下载
-
2023-10-27 21:38:27
微信
赏
支付宝
文档简介:
C
M
Y
CM
MY
CY
CMY
K
33359-ÏÈ“≥.pdf 1 2018/2/1 下午1:52
内 容 简 介
本书是一本通过实战教初学者学习采集数据、清洗和组织数据进行分析及可视化的 Python 读物。书
中案例均经过实战检验,笔者在实践过程中深感采集数据、清洗和组织数据的重要性,作为一名数据行业
的“码农”
,数据就是沃土,没有数据,我们将无田可耕。
本书共分 11 章,6 个核心主题:其一是 Python 基础入门,包括环境配置、基本操作、数据类型、语
句和函数;其二是 Python 爬虫的构建,包括网页结构解析、爬虫流程设计、代码优化、效率优化、容错
处理、
反防爬虫、
表单交互和模拟页面点击;
其三是 Python 数据库应用,
包括 MongoDB、
MySQL 在 Python
中的连接与应用;其四是数据清洗和组织,包括 NumPy 数组知识、pandas 数据的读写、分组变形、缺失
值异常值处理、时序数据处理和正则表达式的使用;其五是综合应用案例,帮助读者贯穿爬虫、数据清洗
与组织的过程;
最后是数据可视化,
包括 Matplotlib 和 Pyecharts 两个库的使用,
涉及饼图、
柱形图、
线图、
词云图、地图等图形,帮助读者进入可视化的殿堂。
本书以实战为主,适合 Python 初学者及高等院校的相关专业学生,也适合 Python 培训机构作为实验
教材使用。
未经许可,不得以任何方式复制或抄袭本书之部分或全部内容。
版权所有,侵权必究。
图书在版编目(CIP)数据
Python 3 爬虫、数据清洗与可视化实战 / 零一,韩要宾,黄园园著. —北京:电子工业出版社,2018.3
ISBN 978-7-121-33359-0
Ⅰ. ①P… Ⅱ. ①零… ②韩… ③黄… Ⅲ. ①软件工具-程序设计 Ⅳ. ①TP311.561
中国版本图书馆 CIP 数据核字(2017)第 321885 号
策划编辑:张慧敏
责任编辑:牛 勇
印 刷:
装 订:
出版发行:电子工业出版社
北京市海淀区万寿路 173 信箱 邮编:100036
开 本:787×980 1/16 印张:13.25 字数:200 千字
版 次:2018 年 3 月第 1 版
印 次:2018 年 3 月第 1 次印刷
印 数:3000 册 定价:49.00 元
凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社发行......
评论
发表评论