Python网络爬虫从入门到实践.html
- 资料大王PDF
-
0 次阅读
-
0 次下载
-
2023-11-19 22:32:10
微信
赏
支付宝
文档简介:
推荐序一
我们正处于飞速发展的大数据时代。不同于以往,现如今丰富的数据信息让我们有能力更好地了解消费者、顾客和竞争对
手。通过电商网站评论收集可以及时知悉顾客对于产品的看法,通过微博数据收集可以及时洞察潜在消费者的购买意向和需求,
通过对手网站信息收集可以及时知晓对手的实时动态,真正做到运筹帷幄之中,决胜千里之外。
本书就是帮助你打开数据信息收集大门的钥匙!本书从最基本的Python语言讲起,完整地介绍了爬虫程序的每一个知识模
块,同时附有最新案例教大家如何利用学到的知识进行实操,让不了解Python语言的人也可以在短时间内掌握爬虫程序的编
写,快速成长为爬虫高手。本书条理清晰、层次分明,实用性极强。
作者唐松是一名年轻有为、经验丰富的数据分析专家。他通过这本书和读者分享多年网络爬虫和数据挖掘的经验。这本书是
IT人士、企业管理人员、市场营销人员和有志于在数据分析方面有所突破的人士值得一读的好书。
香港中文大学市场系教授
刘建南
2017年6月26日
推荐序二
“工欲善其事,必先利其器。”
───《论语·卫灵公》
读这本书需要考虑这样一个问题:到底是学习Python重要,还是掌握网络爬虫重要,抑或两者一样重要?对于这个问题的
回答将直接影响读者最后能从这本书里学到什么。我来给大家一个简单的定义,网络爬虫是“事”,而Python是“器”,是用
来进行网络爬虫的锋刃。在这个定义下,这一问题就转化成了究竟是“事”重要还是“器”重要。
如果你是管理者,那么这个答案就更接近于“事”。因为管理者在向所在的团队发号施令之前,要先思考你的想法到底能否
和所在团队的技术优势相契合。近年来,我们眼见大数据以“迅雷不及掩耳之势”席卷全球,但这场旋风的背后是一个残酷的事
实:很多公司在迈入大数据领域后遭遇“滑铁卢”。究其原因,管理层的惰性首当其冲。当管理层只知道在高尔夫球场对大数据
高谈阔论时,我们又如何期冀技术部门能够懂得并且做出管理者想要做的“事”呢?因此,对于本书的前12章,管理者要能够
清晰地回答两个问题:第一个问题是这个章节探讨的是什么问题,第二个问题是为什么要探讨这个问题。举个例子,对于第1
章,如果你的公司想开发一款新的绿色产品,当你想通过爬取淘宝网上所有绿色产品(如空气净化器)的销量数据来做潜在市场
评估时,就要考虑爬虫有哪些潜在的法律纠纷、公司的爬虫合不合法。再举个例子,对于第6章,你需要思考数据的存储对公司
有什么影响,如何存储数据更有利于公司各个部门(如销售部门)的高效利用,能够更方便地与公司的数据库对接等。
如果你是技术人员、学者或技术“小白”,这本书就是教你如何“利其器”。与其认为是通过Python学习网络爬虫,读者
不如把......
评论
发表评论