语言与数学
2011-1
世界图书出版公司
冯志伟
213
无
1989年,当时的北京大学校长丁石孙教授决定出版一套《数学·我们·数学》的丛书,内容包括“数学与经济”、“数学与军事”、“数学与教育”、“数学与语言”等许多方面,丁石孙校长委托北京大学数学系马希文教授找我,希望我写一本《数学与语言》。我是一个语言学工作者,当时正从事机器翻译和信息检索等应用系统的开发研究,接触到不少语言学中的数学方法问题,对于数学与语言之间关系的问题作过一些思考,因此,我欣然接受了丁石孙教授的这个任务,历时两年,写成了这本《数学与语言》专著,于1991年出版。 在这本专著中,我从数学的角度,对于自然语言的性质进行了深入的思考,明确地指出,除了索绪尔过去提出的语言符号的任意性之外,语言符号还具有另外7个明显的特性,它们是:语言符号的随机性、语言符号的冗余性、语言符号的离散性、语言符号的递归性、语言符号的层次性、语言符号的非单元性、语言符号的模糊性。我提出的语言符号的这7个新的特性,显然补充了索绪尔关于语言符号任意性的思想,使我们对于语言符号的特性有了更加深刻的认识。 我在本书中提出语言符号的这7个新的特性之后,引起了许多语言学家的关注,有的语言学家指出,语言符号的这7个特性,反映了“信息时代的语言观”。语言学家刘海涛在本书的书评中指出,语言符号的这7个特性应当成为“信息时代语言学研究的基础”,并指出,本书“值得每一位语言工作者研读”。19年过去了,我提出的语言符号这7个特性的“语言观”仍然显得很有生命力,越来越多的事实将会继续证明这种“语言观”的正确性。 本书在1991年出版时只印了1400册,早已销售一空。不少读者尽管听说过此书,但是,踏破铁鞋无觅处,根本买不到此书。
如何实现语言的机器翻译?如何从海量的语言文字中抽取有用信息?如何利用自然语言进行人机对话?自然语言与计算机程序语言是否一致?如何自动合成语音……信息时代对自然语言的处理使语言学与数学紧密结合在一起。 作者从事计算语言学研究几十年,潜心探索出语言符号的七种新特性。本书详细论述了这七种特性与数学的关系,反映了当前国内外语言与数学关系研究方面的最新成果。 本书内容丰富,讲解深入浅出,文字流畅易读,可供广大语言学、教学工作者,以及对语言与数学感兴趣的相关人士阅读。语言符号的随机性与统计数学、语言符号的冗余性与随机过程、语言符号的离散性与集合论、语言符号的递归性与公理化方法、语言符号的层次性与图论、语言符号的非单元性与复杂特征的运算、语言符号的模糊性与模糊数学。
冯志伟,1939年生,云南昆明人,计算语言学家,专门从事语言学和计算机科学的跨学科研究。他先后在北京大学和中国科学技术大学研究生院两次研究生毕业,获双硕士学位。曾师从法国著名数学家、原国际计算语言学委员会主席沃古瓦(B,Vauquois)教授专门研究数理语言学和机器翻译问题。
作者现为国家教育部语言文字应用研究所研究员、博士生导师,任中国语文现代化学会副会长、中国人工智能学会理事、国家语言文字工作委员会21世纪语言文字规范(标准)审定委员会委员等职。在国际上,任TELRI(Trans-European Language Resources Infrastructure)(跨欧洲语言资源基础建设工程学会)的顾问委员会委员,UCL(International Journal of Corpus Ling Linguistics)(语料库语言学国际杂志)的编委等职。
他的主要著作有《数理语言学》(上海知识出版社1985年),《机器翻译研究》(中国对外翻译出版公司,2004年),《自然语言处理的形式模型》(中国科学技术大学出版社,2009年)等,主要译著有《自然语言处理综论》(电子工业出版社,2005年)等,发表论文200余篇。
信息时代语言学研究的基础——读《语言与数学》有感再版前言绪言——语言学是数学和人文科学之间的桥梁第一章 语言符号的随机性与统计数学 第1节 语言符号的随机性 第2节 字频和词频的统计 第3节 语音统计研究 第4节 方言研究中的统计方法 第5节 计算风格学 第6节 古代语言研究中的统计方法第二章 随机过程与语言符号的冗余性 第1节 语言的使用与马尔可夫链 第2节 语言的熵和语言符号的冗余性第三章 语言符号的离散性与集合论 第1节 语言符号的离散性 第2节 语言的集合论模型第四章 语言符号的递归性与公理化方法 第1节 语言符号的递归性 第2节 生成语法的公理化方法第五章 语言符号的层次性 第1节 语言符号的层次性 第2节 树形图第六章 语言符号的非单元性与复杂特征的运算 第1节 语言符号的非单元性 第2节 复杂特征的运算第七章 语言符号的模糊性与模糊数学 第1节 语言符号的模糊性 第2节 模糊数学在语言研究中的应用附录:胡耀邦同志鼓励我研究数理语言学
总之,电子计算机的出现和广泛使用,就像催化剂一样促进了数学和语言学的结合。数学渗透到了形态学、句法学、词汇学、语音学、文字学、语义学等语言学的各个分支部门,促进了语言学的数学化。而语言学的数学化则是语言学现代化的一个重要内容,这些内容被概括在“数理语言学”(mathematieal linguistics)这个新兴学科中,并得到了迅速的发展。 1955年,美国哈佛大学首先创办了数理语言学讨论班,1957年正式开设了数理语言学课程。接着,麻省理工学院、密歇根大学、宾夕法尼亚大学、印第安纳大学、加利福尼亚大学都相继开设了数理语言学课程。同年,日本成立了计量语言学会,创办了数理语言学杂志《计量国语学》,德国的波恩大学也开设了数理语言学课程,苏联在莫斯科大学、列宁格勒大学及莫斯科国立第一外国语师范学院也进行了数理语言学的研究工作。1958年,莫斯科大学、高尔基大学、萨拉托夫大学、托姆斯克大学,分别给数学系及语文系的学生开设了数理语言学的选修课,并在列宁格勒大学设置了数理语言学专业。 此外,罗马尼亚、匈牙利、捷克、英国、法国、挪威、波兰、瑞典等国,都先后开展了数理语言学的研究工作,有的国家还创办了专门的刊物,成立了专门的研究机构。 我国从20世纪50年代起便开展了数理语言学的研究工作。1982年,北京大学中文系给汉语专业的学生开设了《语言学中的数学问题》的选修课,首先在我国开设了数理语言学方面的课程。①1985年,上海知识出版社出版了我国的第一本数理语言学专著——《数理语言学》。数学的定量的研究方法已逐渐受到我国传统的语言学家们的注意,并开始用到他们的研究工作中去,在用数学方法研究汉语的句子结构、汉字频率统计、汉语单词频率统计、频率词典的编制、方言定量分析、汉字熵值测定等方面,都取得一定的成绩。 数理语言学的研究常常要用电子计算机作为工具,因此,它与计算语言学的研究是联系在一起的。当前,数理语言学与计算语言学有合流的倾向。这清楚地说明,语言学、数学、计算机科学有着不解之缘。
无
这本书很新奇,运用了在国外常用,但是在国内很少见的数学方法来研究语言学
语言学严格来讲,是一门系统性很强的科学,而不是像文学艺术那样凭借感性来进行创造的学科
所以用数学来研究很合适,只是国内在这方面做的还很不够
作者是研究语言学数十年的资深人士,在数学和语言学方面很有造诣
虽然由于国内体制的限制(语言学被人为放到文学之下),数学方法咋语言学中的应用还受到很大限制
但是相信随着僵化体制的破除,数学终将在语言学研究中发挥很大的作用
新版的语言与数学,内容很有意思,没深入看,觉得有点难。
还没找到时间细看。。。。
不错的,很有研究
对于计算机语言学学习较有用,讲得浅而易懂