谷歌吴军:数学之美
- 资料大王PDF
-
0 次阅读
-
0 次下载
-
2024-04-14 20:44:19
微信
赏
支付宝
文档简介:
Table of Contents
封面
关于本书
声明
前言
系列一: 统计语言模型
系列二 -- 谈谈中文分词
系列三 -- 隐含马尔可夫模型在语言处理中的应用
系列 4 -- 怎样度量信息?
系列五 -- 简单之美:布尔代数和搜索引擎的索引
系列六 -- 图论和网络爬虫
系列七 -- 信息论在信息处理中的应用
系列八-- 贾里尼克的故事和现代语言处理
系列九 -- 如何确定网页和查询的相关性
系列十 有限状态机和地址识别
系列十一 - Google 阿卡 47 的制造者阿米特.辛格博士
系列 12 - 余弦定理和新闻的分类
系列十三 信息指纹及其应用
十四 谈谈数学模型的重要性
系列十五 繁与简 自然语言处理的几位精英
系列十六(上) 不要把所有的鸡蛋放在一个篮子里
系列十六 (下)- 不要把所有的鸡蛋放在一个篮子里
系列十七 闪光的不一定是金子 谈谈搜索引擎作弊问题
系列十八 - 矩阵运算和文本处理中的分类问题
系列十九 - 马尔可夫链的扩展 贝叶斯网络
系列二十 -自然语言处理的教父 马库斯
系列二十一 - 布隆过滤器
系列二十二 由电视剧《暗算》所想到的
系列 二十三 输入一个汉字需要敲多少个键
系列 二十四 从全球导航到输入法——谈谈动态规划
数学之美
Google 吴军
内容简介
也许大家不相信,数学是解决信息检索和自然语言处理的最好工具。它
能非常清晰地描述这些领域的实际问题并且给出漂亮的解决办法。每当
人们应用数学工具解决一个语言问题时,总会感叹数学之美。我们希望
利用 Google 中文黑板报这块园地,介绍一些数学工具,以及我们是如
何利用这些工具来开发 Google 产品的。
系列一: 统计语言模型 (Statistical Language Models)
Google的使命是整合全球的信息,所以我们一直致力于研究如何让机器
对信息、语言做最好的理解和处理。长期以来,人类一直梦想着能让机
器代替人来翻译语言、识别语
音、认识文字(不论是印刷体或手写
体)和进行海量文献的自动检索,这就需要让机器理解语言。但是人类
的语言可以说是信息里最复杂最动态的一部分。为了解决
这个问题,
人们容易想到的办法就是让机器模拟人类进行学习 - 学习人类的语法、
分析语句等等。尤其是在乔姆斯基(Noam Chomsky 有史以来最伟大的
语言学家)提出 “形式语言” 以后,人们更坚定了利用语法规则的办法
进行文字处理的信念。遗憾的是,几十年过去了,在计算机处理语言领
域,基于这个语法规则的方法几乎毫无突破。
其实早在几十年前,数学家兼信息论的祖师爷香农 (Claude Shannon)就
提出了......
评论
发表评论