数学之美读书笔记
《数学之美》读书笔记《数学之美》读书笔记 《数学之美》读书笔记 《数学之美》读书笔记《数学之美》读书笔记 1 1 读完本书,第一感受:次奥!原来数学如此多的原理模型概念都可以用去 解决各种 IT 技术问题啊。特别是语言识别和自然语言处理这类问题完全就是建立 在数学原理之上的。总之,这本书就是用非常深入浅出的话去说明如何用数学方法 去解决计算机的各种工程问题。这是一本讲道,而不是术的书。 要完全读懂这本 书,我觉得至少需要掌握这三门课:高等数学,离散数学,还有概率论与数理统 计。唉我当初数学学得太水了,还挂了高数啊。有好的概念没看懂,以后有时间在 好好看吧。如果想搞计算机研究的话,数学基础必不可少,别总在抱怨各种数学课 上的东西一辈子都用不着。 发现作者对人类自然发展的认识非常深,其从语言,文字,数学的产生发 展,信息的传播记录得出了这个结论:信息的产生传播接收反馈,和今天最先进的 通信在原理上没有任何差别。就算是科学上最高深的技术,那也是模拟我们生活中 的一些基本原理。 我们今天使用的十进制,就是我们扳手指扳了十次,就进一次位。而玛雅 文明他们数完了手指和脚指才开始进位,所以他们用的是二十进制。实际上阿拉伯 数字是古印度人发明的,只是欧洲人不知道这些数字的真正发明人是古印度,而就 把这功劳该给了“二道贩子”阿拉伯人。 语言的数学本质 任何一种语言都是一种编码方式,比如我们把一个要表达的意思,通过语 言一句话表达出来,就是利用编码方式对头脑中的信息做了一次编码,编码的结果 就是一串文字,听者则用这语言的解码方法获得说话者要表达的信息。 自然语言处理模型 计算机是很笨的,他们唯一会做的就是计算。自然语言处理在数学模型上 是基于统计的,说一个句子是否合理,就看看他出现的可能性大小如何,可能性就 是用概率来衡量,比如一个句子,出现的概率为 1/10^10,另一个句子出现的概率 为 1/10^20,那么我们就可以说第一个句子比第二个句子更加合理。当然这要求有 足够的观测值,他有大数定理在背后支持。 最早的中文分词方法 这句话:“同学们呆在图书馆看书”,如何分词?应该是这样:同学们/ 呆在/图书馆/看书。最先的方法是北航一老师提出的查字典方法,就是把句子从左 道右扫描一遍,遇到字典里面出现的词就标示出来,遇到复合词如(北京大学)就 按照最长的分词匹配,遇到不认识的字串就分割成单个字,于是中文的分词就完成 了。但是这只能解决 78 成的分词问题,但是“像发展中国家”这种短语它是分不 出来的。后来大陆用基于统计语言模型方法才解决了。 隐含马可夫模型(没这么看懂) 一直被认为是解决打多数自然语言处理问题最为快速有效的方法,大致意 思是:随机过程中各个状态的概率分布,只与他的前一个状态有关。比如对于天气 预报,我们只假设今天的气温只与昨天有关而与前天没有关系,这虽然不完美,但 是以前不好解决的问题都可以给出近视值了。 一个让我印象深刻的观点: 小学生和中学生其实没有必要花那么多时间去读书,其觉得最主要的是孩 子们的社会经验,生活能力,和那时候树立起来的志向,这将帮助他们一生。而中 学生阶段花很多时间比同伴多读的课程,在大学以后可以用非常短的时间就可以读 完。因为在大学阶段,人的理解能力要强很多,比如中学要花 500 小时才能搞明白 的内容,大学可能花 100 小时就搞定了。学习和教育是一个人一辈子的事情,很多 中学成绩好的人进入大学后有些就表现不太好了,要有不断学习的动力才行。 余弦定理和新闻分类 我在新浪干过一年多新闻,这篇认真看了一篇,很吃惊原理 cos x 与新闻 分析也有关系啊。google 的新闻服务是由计算机自动整理分类的。而传统的媒体 如门户网站是让编辑读懂新闻,找到主题,再分类分级别的,真苦逼啊。计算机自 动分类原理是这样:如一篇新闻有 10000 个词,组成一个万维向量,这个向量就代 表这篇新闻,可以通过某种算法表达这个新闻主题的类型,如果两个向量的方向一 致,说明对应的新闻用词一致,方向可用夹角表示,夹角可用余弦定理表示,所以 当夹角的余弦值接近于 1 时,这两篇新闻就可以归为一类了。 没看懂的东西: 布尔代数:布尔代数把逻辑学和数学合二为一,给了我们一个全新的视角 看世界。 网络爬虫的基本原来是利用了图论的广度优先搜索和深度优先搜索。 搜索引擎的结果排名用了稀疏矩阵的计算。 地图最基本的计算是利用了有限状态机和图论的最短路径。 密码学原理,最大熵模型,拼音输入法的数学模型,布隆过滤器,贝叶斯 网络等等。 任何事物都有它的发展规律,当我们认识了规律后,应当在生活工作中遵 循规律,希望大家透过 IT 规律的认识,可 以举一反三的总结学习认识规律,这样 有助于自己的境界提升一个层次。 任何问题总是能找到相应的准确数学模型,一个正确的数学模型在形式上 应当是简单的,一个好的方法在形式上应当也是简单的。简单才是美。 《数学之美》读书笔记《数学之美》读书笔记 2 2 最近看了这本《数学之美》,不得不感叹一句,可惜早已身不在起点。 我读书的时候,数学成绩一直都很好,虽然离开学校已经 10 多年,自觉 当初的知识还是记得很多,6~7 年前再考线性代数和概率论,还是得到了很高的分 数。不过我也和大部分人一样,觉得数学没有太多用处,特别是高中和大学里面学 的,那些三角函数,向量,大数定律,解析几何,除了在考试的题目里面用一下, 平时又有什么地方可以用呢? 看了《数学之美》,惊叹于数学的浩瀚和简单,说它浩瀚,是因为它的分 支涵盖了科学的方方面面,是所有科学的理论基础,说它简单,无论多复杂的问 题,最后总结的数学公式都简单到只有区区几个符号和字母。 这本书介绍数学理论在互联网上的运用,平时我们在使用互联网搜索或者 翻译功能的时候,时常会感叹电脑对自己的了解和它的聪明,其实背后的原理就是 一个个精美的算法和大量数据的训练。那些或者熟悉或者陌生的数学知识(联合概 率分布,维特比算法,期望最大化,贝叶斯网络,隐形马尔可夫链,余弦定律, etc),一步步构建了我们现在所赖以生存的网上世界。 之所以觉得自己早已身不在起点,是因为上面这些数学知识,早已经不在 我的知识框架之内,就算曾经学过,也不过是囫囵吞枣一样的强记硬背,没有领会 过其中的真正意义。而今天想重头在来学一次,其实已经不可能了。且不说要花费 多少的精力和时间,还需要的是领悟力。而这一些,已经不是我可以简单付出的。 不像物理、化学需要复杂的实验来验证,很多数学的证明,几乎只要有一 颗聪明的头脑和无数的草稿纸,可是光是这颗聪明的头脑,就可以阻拦掉很多人。 有人说多读书就会聪明,我不否认,书本的确会提供很多知识,可是不同的人读同 一本书也会有不同的收货,这就限制于每个人的知识框架和认知水平。就如一个数 学功底好过我的人,看这本书,就会更容易理解里面的公式和推导出这些公式的其 他运用点,而我,只能站在数学的门口,感叹一句,它真的好美吧。 当然,我暂时无法在实际生活中运用这些数学公式,可是书中提到的一些 方法论,还是很有帮助的 1)一个产业的颠覆或者创新,大部分来自于外部的力量,比如用统计学 原理做自然语言处理。 2)基础知识和基础数据是很重要性,只有足够多和足够广的