数学之美
2012-5
人民邮电出版社
吴军
272
248000
无
去年我曾经给吴军的《浪潮之巅》写序,今年很高兴得知他的《数学之美》也即将出版了!和《浪潮之巅》一样,《数学之美》也是当年作为Google资深研究员的吴军在谷歌黑板报上应邀撰写的一系列文章。说实在的,刚开始,黑板报的版主还有点担心这个系列会不会让读者觉得太理论而感到枯燥,但很快这个顾虑就被打消了。《数学之美》用生动形象的语言,结合数学发展的历史和实际的案例,谈古论今,系统地阐述了与现代科技领域相关的重要的数学理论的起源、发展及其作用,深入浅出,受到广大读者尤其是科技类人士的喜爱。之前就曾说过,在我认识的顶尖研究员和工程师里,吴军是极少数具有强大叙事能力和对科技、信息领域的发展变化有很深的纵向洞察力,并能有效归纳总结的人之一。在《数学之美》里,吴军再次展示了这一特点。与《浪潮之巅》不同的是,这次吴军集中阐述了他对数学和信息处理这些专业学科的理解,尤其是他在语音识别、自然语言处理和信息搜索领域多年来的积累 。 从数字和信息的由来,到搜索引擎对信息处理的背后的数学原理,到与搜索相关的众多领域后面的奇妙的数学应用,吴军都娓娓道来。他把数学后面的本质思维写得透彻、生动。不得不说,他的文字,引人入胜,也确实让我们体会到数学的美。在他的笔下,数学不是我们一般联想到的枯燥深奥的符号,而是实实在在源于生活的有趣的现象和延伸。数学,其实无处不在,而且有一种让人惊叹的韵律和美!伽利略曾经说过,“数学是上帝描写自然的语言”;爱因斯坦也曾说过,“纯数学使我们能够发现概念和联系这些概念的规律,这些概念和规律给了我们理解自然现象的钥匙。”我多年来一直也对信息处理、语音识别领域有着一定的研究,深深体会到数学在所有科学领域起到的基础和根本的作用。“哪里有数,哪里就有美”。在这里,我把《数学之美》真诚推荐给每一位对自然、科学、生活有兴趣有热情的朋友,不管你是搞理科还是搞文科的,读一读数学的东西,会让你非常受益,同时能感受到宇宙和世界的美好与奇妙。吴军把之前谷歌黑板报上的“数学之美”系列文章编辑成现在的这本书,花费了大量的心血和时间。他本着十分严谨的态度,在繁忙的工作之余,补充了之前的系列,并几乎重写了所有的文章,既照顾了普通读者的兴趣,又兼顾了专业读者对深度的要求,很让人钦佩。有时我在想,现在的社会多了一点压力和浮躁,少了一点踏实和对自然科学本质的好奇求知。吴军的这本《数学之美》真的非常好。非常希望吴军今后能写出更多这样深入浅出的好书,它们会是给这个社会和年轻人最好的礼物。李开复 2012年 于创新工场
几年前,“数学之美”系列文章原刊载于谷歌黑板报,获得上百万次点击,并被热情的读者广为传播,得到高度评价。读者说,读了“数学之美”,才发现大学时学的数学知识,比如马尔科夫链、矩阵计算,甚至余弦函数原来都如此亲切,并且栩栩如生,才发现自然语言和信息处理这么有趣,才真正明白“数学是科学的皇后”这句名言。
今年,作者吴军博士几乎把所有的文章都重写了一遍,为的是能把高深的原理讲得更加通俗易懂,让非专业读者也能领略数学的魅力。经过改写和重构后,《数学之美》在整体和细节的度上控制得更好。希望读者通过具体的例子学到的是思考问题的方式,学会如何化繁为简,如何用数学去解决工程问题,如何跳出固有思维不断去思考创新。同时书中也留了很多问题给愿意钻研的人做进一步深入思考。
吴军博士,前腾讯公司主管搜索、在线广告和云计算基础架构的副总裁,毕业于清华大学(本科、硕士)和美国约翰·霍普金斯大学(博士)。在清华大学和约翰·霍普金斯大学期间,吴军博士致力于语音识别、自然语言处理,特别是统计语言模型的研究。他曾获得1995年全国人机语音智能接口会议的最佳论文奖和 2000年Eurospeech的最佳论文奖。
吴军博士于2002年加入Google公司。在Google,他和Amit
Singhal(美国工程院院士,世界著名搜索专家)、Matt
Cutts(Google反作弊官方发言人)等三位同事一起开创了网络搜索反作弊的研究领域,并因此获得Google工程奖。2003年,他和Google全球架构的总工程师朱会灿博士等共同成立了中日韩文搜索部门。吴军博士是当前Google中日韩文搜索算法的主要设计者。在Google其间,他还领导了许多研发项目,包括许多与中文相关的产品和自然语言处理的项目,并得到了当时公司首席执行官埃里克·施密特和创始人谢尔盖·布林的高度评价。
吴军博士在国内外发表过数十篇论文,并获得和申请了十余项美国和国际专利。他的《浪潮之巅》一书深受业界的好评。他于2007年起,担任风险投资基金中国世纪基金的董事。2011年起当选为约翰?霍普金斯大学工学院董事会董事,并在该校的国际事务委员会担任顾问。他是国家重大专项“新一代搜索引擎和浏览器”项目的总负责人,从2012年起担任工信部的专家和顾问。
i 出版说明
v 序言1
ix 序言2
xi 前言
第1章 文字和语言 vs 数字和信息
文字和语言与数学,从产生起原本就有相通性,虽然它
们的发展一度分道扬镳,但是最终还是能走到一起。
1 信息
2 文字和数字
3 文字和语言背后的数学
4 小结
第2章 自然语言处理 — 从规则到统计
人类对机器理解自然语言的认识走了一条大弯路。早期
的研究集中采用基于规则的方法,虽然解决了一些简单
的问题,但是无法从根本上将自然语言理解实用化。直
到?? 多年后,人们开始尝试用基于统计的方法进行自
然语言处理,才有了突破性进展和实用的产品。
1 机器智能
2 从规则到统计
3 小结
第3章 统计语言模型
统计语言模型是自然语言处理的基础,并且被广泛应用
于机器翻译、语音识别、印刷体或手写体识别、拼写纠错、
汉字输入和文献查询。
1 用数学的方法描述语言规律
2 延伸阅读:统计语言模型的工程诀窍
3 小结
第4章 谈谈中文分词
中文分词是中文信息处理的基础,它同样走过了一段弯
路,目前依靠统计语言模型已经基本解决了这个问题。
1 中文分词方法的演变
2 延伸阅读:工程上的细节问题
3 小结
第5章 隐含马尔可夫模型
隐含马尔可夫模型最初应用于通信领域,继而推广到语
音和语言处理中,成为连接自然语言处理和通信的桥梁。
同时,隐含马尔可夫模型也是机器学习的主要工具之一。
1 通信模型
2 隐含马尔可夫模型
3 延伸阅读:隐含马尔可夫模型的训练
4 小结
第6章 信息的度量和作用
信息是可以量化度量的。信息熵不仅是对信息的量化度
量,也是整个信息论的基础。它对于通信、数据压缩、
自然语言处理都有很强的指导意义。
1 信息熵
2 信息的作用
3 延伸阅读:信息论在信息处理中的应用
4 小结
第7章 贾里尼克和现代语言处理
作为现代自然语言处理的奠基者,贾里尼克教授成功地
将数学原理应用于自然语言处理领域中,他的一生富于
传奇色彩。
1 早年生活
2 从水门事件到莫妮卡?莱温斯基
3 一位老人的奇迹
第8章 简单之美 — 布尔代数和搜索引擎的索引
布尔代数虽然非常简单,却是计算机科学的基础,它不
仅把逻辑和数学合二为一,而且给了我们一个全新的视
角看待世界,开创了数字化时代。
1 布尔代数
2 索引
3 小结
第9章 图论和网络爬虫
互联网搜索引擎在建立索引前需要用一个程序自动地将
所有的网页下载到服务器上,这个程序称为网络爬虫,
它的编写是基于离散数学中图论的原理。
1 图论
2 网络爬虫
3 延伸阅读:图论的两点补充说明
4 小结
第10章 PageRank — Google的民主表决式网名
网页排名技术是早期的杀手锏,它
的出现使得网页搜索的质量上了一个大的台阶。它背后
的原理是图论和线性代数的矩阵运算。
1 PageRank 算法的原理
2 延伸阅读:PageRank 的计算方法
3 小结
第11章 如何确定网页和查询的相关性
确定网页和查询的相关性是网页搜索的根本问题,其中确
定查询中每个关键词的重要性有多高是关键。是目
前通用的关键词重要性的度量,其背后的原理是信息论。
1 搜索关键词权重的科学度量TF-IDF
页排名技术
2 延伸阅读:TF-IDF 的信息论依据
3 小结
第12章 地图和本地搜索的最基本技术 — 有限划
地图和本地服务中要用到有限状态机和动态规划技术。
这两项技术是机器智能和机器学习的工具,它们的应用
非常广泛,还包括语音识别、拼写和语法纠错、拼音输
入法、工业控制和生物的序列分析等。
1 地址分析和有限状态机
2 全球导航和动态规划
3 延伸阅读:有限状态传感器
4 小结
第13章 Google AK-47 的设计者 — 阿米特·士
在所有轻武器中最有名的是冲锋枪,因为它从不
卡壳,不易损坏,可在任何环境下使用,可靠性好,杀
伤力大并且操作简单。的产品就是按照上述原
则设计的。
第14章 余弦定理和新闻的分类
计算机虽然读不懂新闻,却可以准确地对新闻进行分类。
其数学工具是看似毫不相干的余弦定理。
1 新闻的特征向量
2 向量距离的度量
3 延伸阅读:计算向量余弦的技巧
4 小结
第15章 矩阵运算和文本处理中的两个分类问题
无论是词汇的聚类还是文本的分类,都可以通过线性代
数中矩阵的奇异值分解来进行。这样一来,自然语言处
理的问题就变成了一个数学问题。
1 文本和词汇的矩阵
2 延伸阅读:奇异值分解的方法和应用场景
3 小结
第16章 信息指纹及其应用
世间万物都有一个唯一标识的特征,信息也是如此。每
一条信息都有它特定的指纹,通过这个指纹可以区别不
同的信息。
1 信息指纹
2 信息指纹的用途
3 延伸阅读:信息指纹的重复性和相似哈希
4 小结
第17章 由电视剧《暗算》所想到的 — 谈谈
原理
密码学的根本是信息论和数学。没有信息论指导的密码
是非常容易被破解的。只有在信息论被广泛应用于密码
学后,密码才真正变得安全。
1 密码学的自发时代
2 信息论时代的密码学
3 小结
第18章 闪光的不一定是金子 — 谈谈搜索引擎
题
闪光的不一定是金子,搜索引擎中排名靠前的网页也
未必是有用的网页。消除这些作弊网页的原理和通信
中过滤噪音的原理相同。这说明信息处理和通信的很
多原理是相通的。
第19章 谈谈数学模型的重要性
正确的数学模型在科学和工程中至关重要,而发现正确
模型的途径常常是曲折的。正确的模型在形式上通常是
简单的。
第20章 不要把鸡蛋放到一个篮子里 — 谈谈型
最大熵模型是一个完美的数学模型。它可以将各种信息
整合到一个统一的模型中,在信息处理和机器学习中有
反作弊问题着广泛的应用。它在形式上非常简单、优美,而在实现
时需要有精深的数学基础和高超的技巧。
1 最大熵原理和最大熵模型
2 最大熵模型的训练
3 小结
第21章 拼音输入法的数学原理
汉字的输入过程本身就是人和计算机之间的通信。好的
输入法会自觉或不自觉地遵循通信的数学模型。当然要
做出最有效的输入法,应当自觉使用信息论做指导。
1 输入法与编码
2 输入一个汉字需要敲多少个键 — 谈谈香农
3 拼音转汉字的算法
4 延伸阅读:个性化的语言模型
5 小结
第22章 自然语言处理的教父马库斯和他的
们
将自然语言处理从基于规则的研究方法转到基于统计的
研究方法上,宾夕法尼亚大学的教授米奇?马库斯功不
可没。他创立了今天在学术界广泛使用的语料库,
同时培养了一大批精英人物。
1 教父马库斯
2 从宾夕法尼亚大学走出的精英们
第23章 布隆过滤器
日常生活中,经常要判断一个元素是否在一个集合中。
布隆过滤器是计算机工程中解决这个问题最好的数学工具。
1 布隆过滤器的原理
2 延伸阅读:布隆过滤器的误识别问题
3 小结
第24章 马尔可夫链的扩展 — 贝叶斯网络
贝叶斯网络是一个加权的有向图,是马尔可夫链的扩展。
而从认识论的层面看:贝叶斯网络克服了马尔可夫链那
种机械的线性约束,它可以把任何有关联的事件统一到
它的框架下面。它在生物统计、图像处理、决策支持系
统和博弈论中都有广泛的使用。
1 贝叶斯网络
2 贝叶斯网络在词分类中的应用
3 延伸阅读:贝叶斯网络的训练
4 小结
第25章 条件随机场和句法分析
条件随机场是计算联合概率分布的有效模型,而句法
分析似乎是英文课上英语老师教的东西,这两者有什
么联系呢?
1 句法分析计算机算法的演变
2 条件随机场
3 小结
第26章 维特比和他的维特比算法
维特比算法是现代数字通信中使用最频繁的算法,同时
也是很多自然语言处理的解码算法。可以毫不夸张地讲,
维特比是对我们今天生活的影响力最大的科学家之一,
因为如今基于的移动通信标准主要就是他创
办的高通公司制定的。
1 维特比算法
2 CDMA 技术 — 3G 移动通信的基础
3 小结
第27章 再谈文本自动分类问题 — 期望最大化
算法
只要有一些训练数据,再定义一个最大化函数,采用
算法,利用计算机经过若干次迭代,就可以得到所
需要的模型。这实在是太美妙了,这也许是我们的造物
主刻意安排的。所以我把它称作上帝的算法。
1 文本的自收敛分类
2 延伸阅读:期望最大化和收敛的必然性
3 小结
第28章 逻辑回归和搜索广告
逻辑回归模型是一种将影响概率的不同因素结合在一起
的指数模型,它不仅在搜索广告中起着重要的作用,而
且被广泛应用于信息处理和生物统计中。
1 搜索广告的发展
2 逻辑回归模型
3 小结
第29章 各个击破算法和Google 云计算的基础
Google颇为神秘的云计算中最重要的MapReduce工具,
其原理就是计算机算法中常用的“各个击破”算法,它
的原理原来这么简单 — 将复杂的大问题分解成很多小
问题分别求解,然后再把小问题的解合并成原始问题的
解。由此可见,在生活中大量用到的、真正有用的方法
常常都是简单朴实的。
1 分治算法的原理
2 从分治算法到MapReduce
3 小结
附录
后记
索引
世间万般表象的背后皆有规律。科学研究的真正目的,在于找到这些规律并能够举一反三地应用这些规律。对于自然科学和工程学,包括计算机科学和通信,数学是描述这些规律性最好的工具。做事情的方法有对与错、好和坏之分,从长期看只有采用对的方法、好的方法才能做出好的产品和服务。而任何一个好的方法背后都有充分的理论依据,都有正确的方法论。本书的一个目的在于揭示信息和自然语言处理以及它们在通信和互联网各种应用(语音识别、机器翻译、搜索、分类等)中的数学原理,从而帮助读者认识到:解决这些问题,好的方法是什么。毫无疑问,解决这些问题需要智能,而计算机本身并没有智能,它有的只是巨大的计算能力。只有找到描述这些问题的数学模型,才能利用计算机解决这些需要智能的问题,这样,计算机看上去也似乎聪明起来了。数学之美,首先在于其内容或许复杂而深奥,但形式常常很简单。简单=美,这不仅在科学和工程上成立,而且在产品开发和设计上也是如此,这和设计大师乔布斯“少即是多”的原则不谋而合。同时,数学之美还在于数学原理的通用性和普遍性。一个好的数学模型,常常能解决一系列,甚至是许多看似毫不相干领域的实际问题。在数学上的一点突破,可以带动很多领域和行业的进步。数学给人的印象常常是抽象而深奥、难以理解和应用不明确的。产生这个这个误解的原因是缺乏从数学到应用的桥梁,本书希望抛砖引玉,期待着能有更多的人一起来搭建这座桥梁。
我大学的专业是计算数学,但读到吴军老师的“数学之美”系列文章,才发现马尔科夫过程、矩阵计算,甚至余弦函数原来都如此亲切,并且栩栩如生;才发现自然语言和信息处理这么有趣;才真正明白“数学是科学的皇后”这句名言。相信认真读完这本《数学之美》的朋友们,算法功力都会暴涨N倍,更重要的是发现了数学背后的无穷魅力,学会欣赏数学之美。 ——蒋涛/CSDN&《程序员》创始人 最初看到《数学之美》,是谷歌黑板报上的连载文章。里面的公式并不是很多,但是很多看似颇为复杂的概念,吴军老师却能够如讲故事般娓娓道出,着实看出作者对这些问题有着深入且独到的见解,读后受益匪浅。这次有幸在《数学之美》出版之前拜读了初稿,欣喜看到新书在章节连贯和语言方面都较黑板报的连载文章有了较大的提高,相信每一个喜欢数学、乐意欣赏数学之美的读者,一定会觉得开卷有益。 ——张磊/微软亚洲研究院主管研究员 我不做研究,也自觉没有做研究的底子。然而,数年前看到吴军老师的《数学之美》系列时仍然还是被深深地迷住了。正如作为一个十几年的科幻爱好者,深信在平凡的生活和工作之余应得闲仰望星空一样,作为生活在信息社会的个体,在上微博、搜Google、发邮件之余,关上显示器,能够透过《数学之美》这样的杰作,一窥纷繁涌动的数字世界背后的引擎——数学之美,实乃一件幸事。 ——刘未鹏/《暗时间》作者 第一次接触吴军老师的“数学之美”系列,是在搜索bloom filter资料时,读了其中一篇后,就把其他的文章都读了,感触很多:首先,改变了观点:原以为在计算机系学到的数学基础在工作中一无是处,现在懂得:知识要落地,最重要的是理解知识的由来;其次,任何复杂的问题最终可以用简单的方式去解决,我们往往会陷入不断给问题增加难度的复杂解法,而忽视了简单直接有效的方法。 “数学之美”系列文章,整体和细节的度掌握得很好,通过具体的例子让读者学到的是思考问题的方式,同时留了很多问题给愿意钻研的人做进一步深入思考。BTW, “数学之美”系列,是我在技术领域介绍中读过的最好的文章之一,让人学会如何化繁为简,如何用数学去解决工程问题,如何跳出固有思维不断去思考创新。 ——岑文初/淘宝开放平台技术产品负责人
《浪潮之巅》作者、腾讯公司副总裁吴军最新力作《数学之美》由创新工场董事长兼首席执行官李开复倾力作序推荐。《数学之美》的创作源自点击超百万的谷歌黑板报专题博客,吴军老师应出版要求重新编写。 在《数学之美》中吴军老师带领你领略数学之美,架起从数学到应用的桥梁,教会你如何化繁为简,如何用数学解决工程问题,如何打破思维定式不断思考创新。《数学之美》是献给每一位对自然、科学、生活有兴趣的朋友的礼物。本书荣获第八届文津图书奖。
我大学的专业是计算数学,但读到吴军老师的“数学之美”系列文章,才发现马尔科夫过程、矩阵计算,甚至余弦函数原来都如此亲切,并且栩栩如生;才发现自然语言和信息处理这么有趣;才真正明白“数学是科学的皇后”这句名言。相信认真读完这本《数学之美》的朋友们,算法功力都会暴涨N倍,更重要的是发现了数学背后的无穷魅力,学会欣赏数学之美。——蒋涛 CSDN&《程序员》创始人最初看到《数学之美》,是谷歌黑板报上的连载文章。里面的公式并不是很多,但是很多看似颇为复杂的概念,吴军老师却能够如讲故事般娓娓道出,着实看出作者对这些问题有着深入且独到的见解,读后受益匪浅。这次有幸在《数学之美》出版之前拜读了初稿,欣喜看到新书在章节连贯和语言方面都较黑板报的连载文章有了较大的提高,相信每一个喜欢数学、乐意欣赏数学之美的读者,一定会觉得开卷有益。——张磊 微软亚洲研究院主管研究员我不做研究,也自觉没有做研究的底子。然而,数年前看到吴军老师的《数学之美》系列时仍然还是被深深地迷住了。正如作为一个十几年的科幻爱好者,深信在平凡的生活和工作之余应得闲仰望星空一样,作为生活在信息社会的个体,在上微博、搜Google、发邮件之余,关上显示器,能够透过《数学之美》这样的杰作,一窥纷繁涌动的数字世界背后的引擎——数学之美,实乃一件幸事。——刘未鹏 《暗时间》作者第一次接触吴军老师的“数学之美”系列,是在搜索bloom filter资料时,读了其中一篇后,就把其他的文章都读了,感触很多:首先,改变了观点:原以为在计算机系学到的数学基础在工作中一无是处,现在懂得:知识要落地,最重要的是理解知识的由来;其次,任何复杂的问题最终可以用简单的方式去解决,我们往往会陷入不断给问题增加难度的复杂解法,而忽视了简单直接有效的方法。“数学之美”系列文章,整体和细节的度掌握得很好,通过具体的例子让读者学到的是思考问题的方式,同时留了很多问题给愿意钻研的人做进一步深入思考。BTW,“数学之美”系列,是我在技术领域介绍中读过的最好的文章之一,让人学会如何化繁为简,如何用数学去解决工程问题,如何跳出固有思维不断去思考创新。——岑文初/淘宝开放平台技术产品请看看本书的章节名称,有“文字和语言vs数字和信息”、“自然语言处理——从规则到统计”、“统计语言模型”、“谈谈中文分词”、“隐含马尔可夫模”、“贾里尼克和现代语言处理”、“布尔代数和搜索引擎”、“图论和网络爬虫”、“余弦定理和新闻的分类”、“信息指纹及其应用”、“逻辑回归和搜索广告”等,似乎太过专业性,实际上具有高中和大学低年级的同学们都能看得懂,当然本书因此也可以称得上是“高级科普”。总之,本书是在介绍信息技术背后的数学原理,以及这些技术和原理背后的科学家的故事和他们从事科学研究的方式方法。故事生动翔实而富有教益,是一部优秀的科学方法论的启蒙读物。——王渝生 文津图书奖科普类图书专家评审委员会主任,中国科技馆原馆长,北京市科协原副主席人民邮电出版社《数学之美》,作者吴军是非数学专业的理工科出身的企业界人士,他不落窠臼,独辟蹊径,站在信息时代的高度,领略数学应用于工程技术中的实质内容和内在美感,具有科学方法论的启蒙意义。——王渝生 文津图书奖科普类图书专家评审委员会主任,中国科技馆原馆长,北京市科协原副主席
无
《浪潮之巅》作者、谷歌公司Principal Engineer吴军博士最新力作《数学之美》由创新工场董事长兼首席执行官李开复倾力作序推荐。《数学之美》的创作源自点击超百万的谷歌黑板报专题博客,吴军应出版要求几乎改写和重构了所有的文章,既照顾了普通读者的兴趣,又兼顾了专业读者对深度的要求。
在《数学之美》中,吴军带领您领略数学之美,架起从数学到应用的桥梁,教会您如何化繁为简,如何用数学解决工程问题,如何打破思维定式不断思考创新。
《数学之美》是献给每一位对自然、科学、生活有兴趣的朋友的礼物。本书荣获第八届文津图书奖。
大学三年,聊天时有时会听到一些奇怪的言论,比如:“现在学的这些东西有什么用,大学怎么都教这些过时的东西。“ 诚然大陆学校有时会教授一些过时的东西,譬如听说有的学校还教授vb和fortran这样的语言,但我知道这话常常针对数学、通信原理、数电、模电这类的基础理论的,背后的潜台词是:”工作以后都是用现成的芯片、工具,这些几十年上百年历史的理论能有什么用。“ 说这样话的人通常都没有任何学习的觉悟,除了为对付考试啃一啃课本,他们从来不愿意去翻任何知识性书籍,也从来不会好奇他们学的这些基础理论到底有什么作用,他们恨不能直接学一门类似于”嵌入式开发“这种实用的技术,然后最好这门”技术“能一劳永逸管一辈子饭碗呢 。 每一次我都想反驳,可我又没法反驳,因为我也说不清楚这些基础理论到底是如何服务于具体技术的,而它们在实践中又为什么非常重要。所以当读到吴军博士的这本《数学之美》时,我发现这本书解答了我和很多学IT的本科学生长期以来的困惑,连续两天手不释卷读完,深深被书里精彩的内容吸引住了。 个人感觉这本书非常适合信息领域大三、大四阶段的学生阅读,读得早了,会因为有些课程没有学过不能读懂或者读来没有感觉,读得迟了恐怕就会感慨怎么没有早点读到这本书。 我们本科阶段学习的那些"线代、统计、图论、通信原理时常常会怀疑这些理论到底有什么用呢?读了这本书算是长了见识,原来这些理论还可以这么玩。比如计算机自然语言处理可以抽象成非常简单的通信模型和统计学模型,然后一个简单条件概率公式加上一个马尔可夫假设就可以做到机器翻译和语音识别......比如简单的布尔代数就是支撑搜索引擎索引的数学基础,一个漂亮的page rank矩阵乘法迭代加上一个非常符合直觉却有信息论支撑的TF-IDF公式,就可以非常大程度地改善搜索结果的质量......比如余弦公式竟然能够用来做新闻分类!?线性代数除了可以用来解方程组,那些莫名其妙不知干嘛用的特征值、奇异值居然可以用作内容聚合分类!? 读了这本书之后才真心信服,原来这些数学知识除了用作科学家们的头脑游戏以外,确实有非常令人惊叹的实际应用。得益于吴军博士深入浅出的宏观讲解,和恰到好处的细节展现,读者很容易能感受到,数学纵使在计算和证明上有许多繁琐巧妙的细节,但数学模型本身却是高度简洁高度具有概括力的,一些看似毫不相关的领域居然可以用同一个简单的数学模型来构建(比如新闻分类背后的余弦定理)——我想,这大概就是所谓的数学之"美”了吧,它是纷繁技术细节背后最曼妙的骨架,没有一丝累赘,简洁、和谐、有力。 读这本书的过程也是数学建模思维训练的一种训练,相信很多参加过数模训练的同学都会同意数模训练在思考实际问题时带来的好处。阅读本书,更能体会到数学建模思维在工程实践领域中的重要作用。作者在书中数次提到,在工程领域有时候靠瞎凑也能够得到一个凑合可用的结果,但长期来看维护这些瞎凑搭起来的东西代价非常巨大,不仅结构混乱丑陋,而且由于说不清瞎凑背后的道理,在以后的修改维护时也根本无从下手;反之,如果从更高的数学模型层面去抽象问题,去寻找一个正确的模型框架,就可以有条理地慢慢去填充细节,逐渐达到完善。这样的解决方案不仅能达到需求,而且结构清晰道理明了,便于日后的维护和修正(这大概也是数学之美的另一种表现吧)。作者在后记里是这样说明他的写作意图的:“我更希望让做工程的年轻人看到信息技术行业正确的做事情的方法。”作为一个写代码和做实验常常没有厘清框架思路,在实验中用凑来得出正确结果的学生码农,读到这些教诲时,我感到十分汗颜。 关于用数学建模思维去宏观把握问题的研究方向,书中的一个例子让人印象深刻:作者介绍了用信息论的模型来思考如何改善搜索引擎的结果,即改善搜索结果的本质是引入更多的信息,所以在信息不够的时候应该做的是如何多问一问用户,除此之外在细节处玩弄数学公式和算法是不可能有效果的,而更糟的结果是引入人为的干预——它在满足部分用户的需求同时,必然使其他用户得到更糟糕的结果。 这本书同时也是一本科研方法论的启蒙读物。本科阶段,我们接触科研的机会并不多,即使参加了一些大学生科研立项活动,在这方面也不足以得到足够的视野。这本书在介绍信息技术背后数学原理的同时,也讲了很多技术背后科学家们的故事以及他们从事科学研究的方式方法,故事生动翔实富有教益,是一本优秀的科研方法论读物。书中富有启发的故事有不少,比如:通信领域出身的贾里尼克教授采用通信领域的模型方法打破了传统计科基于规则的思维,为自然语言处理建立了统计学模型的框架,这个故事给人的启发是跨界思维和学科融合非常重要,因此很多知识即使看上去没有直接用途,也不要轻下结论,广泛地联系和运用所学的知识,并且用数学思维去抽象和提炼它们,找寻共通点,常常会有了不起的创造。而辛格博士和托勒密地心说的故事,告诉我们简单的模型常常有效和快捷,而非常复杂的模型不仅繁琐,而且常常是走错了方向。 "道"是做事的原理和原则,“术”是具体的做事方法。吴军博士在书里的一段话使我深感认同:“这本书的目的是讲道而不是讲术。很多具体的搜索技术很快会从独门绝技到普及,再到落伍,追求术的人一辈子工作很辛苦。只有掌握了搜索的本质和精髓才能永远游刃有余。”回到这篇评论的开头,很多人希望躲开抽象和看似玄虚无用的道,直接掌握一门一劳永逸的术——可惜这样的捷径却是没有的,如果有的话,大概就是认真地去学习体会那些道,然后再用道来指导这些不断变动似乎永远难以追上潮流的术吧。 嗯,学好数学,天天向上。
数学之美(第八届文津图书奖获奖作品,架起从数学到应用的桥梁,《浪潮之巅》作者吴军最新力作,李开复作序推荐,Google黑板报百万点击!)原来数学这么有用。
架起从数学到应用的桥梁,《浪潮之巅》作者吴军最新力作,李开复作序推荐,Google黑板报百万点击!
自己是计算机专业研究生,去年开始看了吴军的浪潮之巅,感觉技术出身的吴军文笔如此优美,科技企业的兴衰娓娓道来,后来又关注到谷歌黑板报的数学之美,把信息检索领域的数学基础讲的简洁明了,看到出书了果断买
可以说在这本书当中,吴军先生将枯燥的数学进行了很艺术的处理,特别是对于互联网当中运用的复杂的数学原理都进行了艺术化的处理,可以让非数学或者非数学或者计算机的爱好者能理解其中的运作。尽管本人非IT专业者但是还是能从中理解到其中数学在计算机领域的应用,特别是数学在搜索等领域解决大数据的处理上的惊人能力。第一次全面的看到了数学所孕育的强大战斗力,通过数学模型的使用,居然能轻而易举的解决上亿张网页的处理与数以百亿计的网页请求。同样也从侧面展示了通过数学探索自然规律的力量。从前根本不知道学习数学,特别是高数和线代复杂的数学运算的用途,但是在本书当中吴军先生以近乎艺术化的语言将如此复杂的数学问题解释的如此的好!实在难得,颇有化繁为简的高超的手段。实际上,从个人的角度这本书更适合给初中或者高中的学生看。这本书当中尽管参杂了大量看似很复杂的数学公式和数学原理,但并非抽象的数学自然哲理,而是简单实用的实例展示。简单的实例举证,让读者能理解运用在google搜索以及在计算机语言识别当中所实用的数学模型等。如果能将这种对数学的运用以及思考理念运用到中学的教育当中,让大量企图通过数学奥赛德学生能真正的领略到数学的魅力而不是单一的解题,而引导学生的数学以及更方面的思考能力,每年数以百万计的奥赛大军当中难道就不能诞生出一个新的google“拉里佩奇”。未必吧!中国的学生欠缺的不是能力,而是能将他们的能力用在刀刃上的机会。吴军先生正式以这种思维模式将数学的另一面展示出来,枯燥的数学运用到实际当中所起的巨大作用。正如吴军先生在书中所阐述的:解题的方法不是最重要的,最重要的是培育一种全新的思维方式才是最重要的。
超喜欢这本书。我是在看了《浪潮之巅》之后被吴军博士的全局战略性眼光所吸引,难得有人具有洞察整个行业的思维,更重要的是,作为工程师的他能拥有如此诙谐、轻松和讲究的文笔,是我所喜欢的书的格调。哈哈。这本《数学之美》更让我惊喜,也是以轻松加故事加类比的手法娓娓且环环相扣的道出了计算机基础的数学理论知识。原来曾经令自己头大的晦涩的理论竟然可以如此简单,嗯,想起了博士的话:经典的算法都是很简单的。
架起从数学到应用的桥梁,《浪潮之巅》作者吴军最新力作
在朋友的介绍下,买下了《数学之美》,这是我至今最喜欢的一本书,没有之一。吴军博士的书中除了介绍数学外,还涉及到信号、通信、网络等领域。把数学运用到生活中,让我首次感受到数学所带来的巨大威力;图论和网络爬虫,余弦定理和新闻的分类、数学模型的重要性等,原来数学真的无处不在。
喜欢吴军,喜欢他是浪潮之巅,就买了数学之美,尽管术语多,但还是很喜欢
看过吴军的浪潮之巅,不会放过他的数学之美
又是吴军博士的一本书。该书也写的很好,深入浅出的讲了信息产业尤其是搜索方面的数学知识,让人大开眼界。如果国内的教材都能写的如此精炼就好了。
通过吴军博士的介绍,我了解到原来看似枯燥的数学知识那么有趣,余弦定理与向量的结合竟然可以用于新闻相似度判断,矩阵的奇异值分解竟然可以用于大批量新闻分类,马尔科夫链与概率的简化计算和统计语言学有莫大的联系。信息论、基于概率的人工智能,吴军博士给我们展现出了数学与计算机之间这些令人耳目一新的东西。
数学教给我们更多的是一种思维方式。也许你工作之后很少用到公理定理,别说非欧几何,就是欧式几何都是简单的应用。但是数学更多的是让我们学会如果更科学、快速的理解这个世界,思考这个世界。认识世界,发现世界从而改变世界,这才是数学的终极奥义。这本书通俗易懂,深入浅出,才看了几十页就爱不释手,恨不得一口气看完,谢谢吴军博士让我更深刻的领会了数学的深奥~
很想把这本书推荐给大一大二正在学高数线数离散概率的学弟学妹们,终于有一本书深入浅出地告诉计算机新学子们我们学数学到底在学些什么了!吴军的文笔一向喜欢,浪潮之巅也特别好!
看过浪潮之巅,听说吴军又出了这本书忍不住收入了囊中。这是一本趣味的数学书,对于我这种大学以后再没学过数学的人而言,是一本难得的趣味科普读物。
非常棒的一本书,让人爱不释手,值得深读。吴军的这本书把数学在lT领域,特别是语音识别和搜索引擎方面的美丽之处给予了精彩演绎,信息论、统计学、概率论在各个领域的奇妙应用,让人感受到绚丽多彩,魅力非凡的数学之美。
这本书无论是专业读者还是非专业读者,都能够从中读出数学在我们日常工作生活中的应用。虽然我对数学确实不感兴趣,但不得不承认数学也有其独特的一面。或许是因为我不够努力,也许是因为我天资不够聪颖,但看了这本书的推荐、序、前言后越发勾起了我对数学的兴趣。同时非常敬佩吴军这样的IT从业者。这本书我会好好拜读,争取早日理解消化。
我这个人数学不好,也不喜欢数学,但看了这本书以后,我内心深处居然有想学数学的冲动,坐等吴军老师的浪潮之巅。
之前读过电子版的《数学之美》,因为喜欢所以买一半纸质的收藏,从事计算机教学多年,深感数学对信息技术的重要性,现在的计算机专业本科生数学基础普遍不高,因此想收集一些有助于提高学生数学学习兴趣、培养数学能力的好书。数学之美就是这样的好书,也真心希望像吴军老师这样的战斗在业界前沿的成功人士,多出版一些这方面的好书。
吴军博士在这本书里面深入浅出地讲解了语言信息处理背后的各种数学知识。
整个阅读的过程中,无论是各个章节的具体内容和技术,还有背后简洁的数学模型,亦或是一些大师的轶事,都让你受益匪浅。
还未读完,但是因为读了吴军网络上的一些《数学之美》的文章,觉得不错然后才买来看的。慢慢学习啊!
强力推荐,读过本书,可以自己写搜索引擎。强大的数学,第一次认识到。让人有强烈的进取欲望。吴军写的很好,很实在,很为读者考虑,这样的书才是真正值得买的书。
吴军老师的数学之美非常值得一看 ,教了数学之道,而不是数学之法
读了浪潮之巅,也读一下吴军博士的这本书,全是科普吧。
吴军博士的对数学的理解,好好
吴军先生能将深奥的数学知识用生动有趣的例子展现出来,有助于学生们理解数学喜爱数学应用数学
我佩服吴军,将科技与文学合为一体。在推荐他的《浪潮之巅》,大学生,青年不得不看
这本是吴军的经典力作,对我们了解数学的思想和方法很有益。
看过各类书籍,觉得吴军博士写的书非常实用,简直就一历史教材,应该让孩子们多学习。
要是有一本全英文版本出版,全球发行,看起来就更过瘾了!一定再次收藏英文版本。
说实话,书中很多有关IT的内容对我这个从事外贸的人来说并不感兴趣,但是他那独特的思维方式,把全球各大品牌公司的过去与未来分析得如此透彻,用独到的眼光和犀利的文笔手法体现出来,一切都被他击得粉碎!非常棒!受益匪浅!学习了!
此书在我们公司上上下下已经得到大力推广,朋友圈都非常喜欢!
内容写得很赞!我认为适合 理工科 研究生 一年级(或更高)的人员,特别是计算机专业。作者吴军的《浪潮之巅》也建议计算机专业本科生或从业人员阅读。
喜欢这本书的作者吴军。写的另外一本书浪潮之巅也不错
平时我们言语、动作、行为、习惯,在吴军老师的书中全部量化,用统计模型进行归类总结,在这里数学不仅仅是枯燥无味的公式,而是生活中实实在在的东西,开阔了我们的思维,尤其对于从事计算机工作的人员,能够重新认识自己所从事的工作的意义,不再是每天简单的增删改查。
以前看过Google黑板报上的几章内容,觉得不错,加上读完了作者的第一本书《浪潮之巅》,对作者的风格和水平很有信心。前不久在微博上看到本书出版人的消息说书已上市,于是到各大网上书店看看,有些网站还是预售状态,当当是现货,赶紧下单购买,第二天上午就收到书了。
本书页数没有《浪潮之巅》多,但是主题不一样。作者以深厚的学术研究背景和长期的工程实践,对书中涉及的数学知识驾轻就熟,相关的故事趣闻也是娓娓道来。在国内已出版的IT图书中,非常新颖。
还在阅读中。。。
期待吴军的作品,文字很有功力,已经读了《浪潮之巅》。
吴军老师一贯的高水准。此次编辑审校很用心,比浪潮之巅初版的错误少很多,赞Just-Pub团队!稍有点遗憾的就是到手感觉书有点单薄。
很喜欢吴军的浪潮之巅,同时也喜欢这个
看了吴军的《浪潮之巅》后发现这哥们的写作水平和认知水平确实非常高,他的书会给你启发的
刚买到的时候,书的背脊开裂了,不过申请换货,一天就解决了,很满意
很喜欢吴军博士的对各种不同事物的思考很独到
作为数学专业毕业的学生,说来有点汗颜。上大学的时候学习理论,各种定理证明,显然艰深难学,虽然有许多内容确实非常漂亮,但是应用这些知识让人倍感茫然。读了数学之美,真切发现理论与实际链接的桥梁在于各种现实的问题,以及善于思考善于抽像的研究者。读后确实受益匪浅,给多年的理论学习很多慰藉以及希望
因为《浪潮之巅》,才买《数学之美》。刚看了开头,不错!作者从理性角度讲述数学的魅力,让我这个数学差生也顿感兴趣。数学缺有不凡魅力!
嗯,刚收到货,感觉书的质量什么都很不错。没有看内容,但应该是名不虚传的。吴军是行业里都很敬佩的前辈,我们都应该向他吸取经验,学习;不仅要学习技术精髓,也要领悟他对生活,对美本身的热爱。
第二次购买送人的,吴军博士专业造诣自不必说,文笔很好意料之外。
看完浪潮之巅后,意犹未尽。一定要再看这本数学大美。
非常浅显易懂。数学之美 和 浪潮之巅 都是好书
先是看了《浪潮之巅》,然后忍不住又买了这本《数学之美》,赞~
吴军博士的两本书,都很不错
数学之美 李开复推荐的 , 讲了一些google 的技术 十分好 干货多
吴军博士的书大赞、、
数学,科学之母。任何学科无限深挖下去,几乎都可以归结为数学的问题。我们学了不少数学,但是就行什么是数学,没有多少人能够说的清楚。本书将带领你去发现数学的美,而不仅仅只是枯燥复杂的计算。推荐。
花了一个星期的时间看完了,很受益。书里面把自然语言、数据结构、离散数学、概率论、线性代数和计算机等串起来讲,深入简出,受益匪浅。边看,边把大学时代学的数学课本又拿了出来,有不懂的就翻翻课本。发现原来大学时代上的数学课,包括数据结构、离散数学、概率论、线性代数等等,其实并不枯燥乏味,他们在计算机的实际应用中无处不在。这本书给我的启发是,在计算机各个应用方面,想要科学、有效地解决问题,背后一定离不开数学模型的理论支持,然后再理论联系实际,能达到事半功倍的效果。往往这个数学模型是非常简单的,并不那么生涩难懂,仔细分析,其实它们都藏在书本里,就看你是不是认真地看过、理解过,还是为了应付考试而看书学习,不能学以致用。
很好的一本书,08年的时候就看谷歌黑板报,没想到作者又出成书了。建议工科男们都看看
这本书整体还是挺不错的,现在舍友和我都在研究。。。。给大家推荐一下!!吴军大神的书 就是好!!
章节安排合理,通俗诱人,一周读完。了解到数学可以在自然语言处理和搜索中有如此多巧妙的应用。
尽管是个文科生,但是吴军的书总是写得这么通俗易懂而且又娓娓道来,推荐!
从我目前看过的章节理解,书中并不是面面俱到讲述各个领域的数学(其实也不可能),也不是纯粹把一些容易引起大家兴趣的数学题汇总起来的书,而是介绍了自然语言识别这个困扰了计算机领域数十年的难题是如何通过特定领域数学知识进行解决的一本比较专业的图书,不过虽然专业领域性较强,但作者还是力争用通俗易懂的语言和示例让更多普通读者理解,是一本不错的科普读物,值得一读,尤其计算机专业的教师和学生。
出于对数学的喜爱看了这本书,这本书的视角独特,不是纯理论性的著作,很好的阐述了数学的应用及其在现实社会所发挥的重要的作用。也许看了这本书也不会激起更多人对数学的爱好,但是会引起更多人有更好的思维方式。不过客观的讲,以这本书的厚度和《浪潮之巅》比起来,价钱有点偏贵,但谁让有“知识是无价”的这句话呢。
看过作者的另外一本书《浪潮之巅》,两本书都很精彩,值得一读;虽然是本讲数学的书,但是读来也是很有乐趣
给老公买的。他是从事计算机工作,系统维护。老公在大学里数学也是满分的。据他说,这本书,适用范围比较窄,相对于搜索那块,大数据的处理,据他说,这本书有些浅浅的,虚浮的感觉。这本书更强调通过数学模型,来解决搜索当中的问题。
上学的时候就害怕数学,计算机中需要修的高数、工程数学更是头疼,但数学之美里说到相关的算法时都用了恰当的例子而显得浅显,推荐!
吴军写的书都很不错 ,内容超棒, 要是能早几年看到这本书就好了
浪潮之巅的作者,顶一下,同时也对数学和程序语言加深了解
吴军的表达能力很强,推荐
从两方面讲:①本人现在在公司就是负责搜索这方面的。以前都是用别人的框架,像lucene或者oacle自带的seachengine,对底层的东西一直一知半解,看了这本书以后,真有恍然大悟的感觉!②这本书就像《浪潮之巅》一样,写的大气磅礴,更重要的坚定了我追求**,踏踏实实,一步一个脚印努力做好自己的信念!最后这是一本喜欢计算机的年轻人都应该读的好书!
之前在网上看过吴军的博客,慕名购买,这个系列的书籍很不错
虽然题目是数学之美,但是行文一点也不枯燥!而且此书主要是讲自然语言处理中的数学模型,正是我需要的!赞!
记的大学的毕业论文就是想写数学之美,但是能力有限,没有写出自己的感觉。现在孩子虽然才5岁,但是觉得应该她从一开始学加减法就能体会到数学之美,就看到这本书,希望先给我们自己充电充电,特别是要妈妈看看。她虽然曾经是专攻理论物理的大学老师,可是给孩子深入浅出讲数学还是有些力不从心,好好储备点方法。
深入浅出,讲得通俗易懂,适合对搜索引擎技术感兴趣但没有太多专业知识背景的人读,读的时候会发现原来数学可以这么美。
本人工科,工作十年,以前常听大人说数学有多重要,我记住了这句话,但我没有理解这句话。工作后理解的数学很重要,但是仍然是没有兴趣学。但现在,当我尝试过几次运用数学的方法去理解、解决工作上遇到了一些问题后,我发现了,就像本书作者所说,数学绝不仅仅是一些数字、符号、公式、定理,这绝不是数学,数学是用来解决生产、生活中遇到的问题的,是解决问题的一种方法,是一种思维方式。
前一阵子因兴趣研究CMUSphinx这套库的应用不得要领,就去查看了下一些语音识别的基本原理的文章,偶然碰到了数学之美。
吴军的书确实很值得一读,科学的态度,严谨而又不失幽默。
吴军的书还是不错的,中国很少有人真正能签下心来写一本不错的书,吴军是个例外
万物皆有源,用数学去解决工程问题,跳出固有思维不断去思考创新
很有趣 喜欢吴军老师的书
前天下单,昨天早上收到,读了20多页,深入浅出,喜欢吴军这种文风,有技术人员的扎实也有文人的才气。
正如书名所说:这本书让读者看到了数学的美、看到了数学的用途。
希望作者将来能够多写点这样类型的书。
很好!吴军老师的。
作者功底深厚,从应用的角度解读数学之美,相较于阅读现今哪些功利性的研究成果,会令读者耳目一新。
吴军老师的书果然经典
吴军的书都不错,很有启发
刚收到还没看,但吴军的书一定要支持。
挺喜欢吴军的书
该书名为数学之美,但主要讲述的是信息化相关的数学应用内容。该书深入浅出,不似其他数学书籍那么枯燥,读起来令人爱不释手,且对相关专业知识的要求较低,值得一读。
绝对好书,支持吴军
感谢吴军老师 佳酿之作!
这本书很好,是我在浪潮之巅之后关注的,本来自己的数学就挺好的,单数买回来以后感觉还是力度有点大!自己的能力不够,继续加油啦
虽然书名数学之美,但说明的是使用数学模型处理语言的方法,适想搞计算机的朋友阅读
书很好读,数学很美。推荐。
作者以浅显易懂的语言,将数学与计算机技术完美的结合了起来,很多算法和思维过程对现实的项目都具有指导意义,同时让我对搜索引擎的了解也进一步加深了
这本书是看了微博推荐才买的。因为妈妈是个数学老师,就买给她看了~她说给学生讲讲数学的美比光学数学知识更重要。
推荐看看,数学之美原来就这样!!!
作者更多的是从数学对现代科技的应用价值角度详尽的回答了一个很多人都在想的问题:学习数学到底有什么用?大部分人认为数学在我们的日常生活中的作用微乎其微,尤其是高等数学。这本著作让人们明白,我们信息时代的快捷方便的生活是建立在数学的地基之上的恢弘建筑群,香农定理,泰勒级数,麦克斯韦方程组和马尔科夫链这些抽象的公式为我们的生活带来了巨大的改变。
要比google黑板报的博客讲解更详细,分析了数学在IT特别是互联网行业的广泛应用,激发人的学习兴趣
关于数学在互联网搜索上的应用、讲的很好、
本书内容对利用数学知识来解决语义理解相关的搜索、比对很有帮助。
数学之美讲述的是数学在科技上的应用,特别是计算机上面,看完后会有股冲动拿数学书出来再看一遍
这本书早就仔细看过了,并且向学生们做了推荐,这本书的特色是总结了计算机处理当中的多种常用的数学算法,这些都是我们关注却找不到合适答案或解释的问题。谢谢作者的数学能力和描述能力。
虽然说自己学数学,但是还不懂原来数学是如此之美
一本好书,以前受到各网友的转载的文章,现在终于出实体书了。,感受数学之美
正版图书,才看一两章,发现其中用数学解决了复杂的自然语言处理问题,数学之美体现出来了!