社交网站的数据挖掘与分析
- 资料大王PDF
-
0 次阅读
-
0 次下载
-
2024-10-19 21:08:57
微信
赏
支付宝
文档简介:
O'Reilly精品图书系列
社交网站的数据挖掘与分析
Mining the Social Web
[美]罗塞尔(Russell,M.A.) 著
师蓉 译
ISBN:978-7-111-36960-8
本书纸版由机械工业出版社于2012年出版,电子版由华章分社(北京华
章图文信息有限公司)全球范围内制作与发行。
版权所有,侵权必究
客服热线:+ 86-10-68995265
客服信箱:service@bbbvip.com
官方网址:www.hzmedia.com.cn
新浪微博 @研发书局
腾讯微博 @yanfabook
目 录
O'Reilly Media,Inc.介绍
业界评论
本书赞誉
译者序
前言
是否要阅读本书
还是不要阅读本书
工具和先决条件
本书约定
代码示例的使用
联系我们
致谢
第1章 绪论:Twitter数据的处理
Python开发工具的安装
Twitter数据的收集和处理
摆弄Twitter的API
频率分析和词汇多样性
tweet图的可视化
综合应用:用Protovis可视化转发的tweet
小结
第2章 微格式:语义标记和常识碰撞
XFN和朋友
使用XFN来探讨社交关系
对XFN数据的广度优先抓取
地理坐标:兴趣爱好的共同主线
维基百科文章+Google地图=自驾游是否成立
(以健康的名义)对菜谱进行交叉分析
对餐厅评论的搜集
小结
第3章 邮箱:虽然老套却很好用
mbox:Unix的入门级邮箱
mbox+CouchDB=随意的Email分析
将文档批量加载到CouchDB中
合理的排序
映射/化简启发的频率分析
couchdb-lucene:全文索引以及更多
将对话线程化到一起
看谁在说话
使用SIMILE Timeline将邮件“事件”可视化
分析你自己的邮件数据
Graph Your(Gmail)Inbox Chrome扩展
小结
第4章 Twitter:朋友、关注者和Setwise操作
REST风格的和OAuth-Cladded API
不,你不能知道我的密码
干练而中肯的数据采集器
一个非常简短的重构子程序
Redis:数据结构服务器
基本的集合操作
使用基本的朋友/关注者度量来增强性能
通过计算共同好友和关注者来计算相似性
影响的度量
友谊图的构建
派系检测与分析
Infochimp“强链接”API
交互式3D图的可视化
小结
第5章 Twitter:tweet,所有的tweet,只有tweet
笔PK剑:和tweet PK机枪(?!?)
对tweet的分析(每次一个实体)
对(Tim的)Tweet的利用
Tim最常转发谁的tweet
Tim的影响力
Tim的tweet中有多少包含hashtag
并置潜在的社交网......
评论
发表评论