语言信息处理丛书
2010-1
王渝光、杨瑞鲲、 李洪平 云南大学出版社 (2010-01出版)
王渝光 著
241
310000
无
语言信息处理,是用计算机对语言信息(包括口语和书面语)进行编码、转换、传输、解码、存储、分析等进行加工处理的科学。语言信息处理是一门与语言学、计算机科学、心理学、数学、控制论、信息论、声学、自动化技术等多学科相联系的交叉性边缘学科。人类利用语言进行交际的过程,实际就是人自身进行语言信息处理的过程。就汉语而言,语言信息处理又叫中文信息处理,包括汉字信息处理和汉语信息处理两个部分。中文信息处理,是自然语言信息处理的一个分支。现阶段的中文信息处理技术,虽有了很大的发展,但离现代化的要求还有较大的差距。许多语言信息处理技术,既需要计算机技术的不断发展,更需要从语言信息处理的角度加强对汉语本身的研究。语言文字是一个国家主权的象征,也是民族自信心的体现。现在世界上的各个国家、民族都比以往任何时候更加珍视自己的语言文字所具有的标志性意义。语言文字是交流的工具,也是文化的载体,承载着丰富、厚重的社会文化信息,服务于社会的经济、政治和文化,是能够产生社会效益和政治、经济、文化、科技等效益的特殊社会资源,是国家最宝贵的财富。语言是人类重要的文化资源和经济资源。当今时代,语言已经进入到经济和高新科技领域,成为经济发展的重要资源。随着信息时代的发展;语言作为经济资源的性质会体现得越来越明显,其经济意义越来越显著。民族共同语是指一个民族内用作共同交际工具的语言。标准语是经过加工规范后的民族共同语,是民族共同语的规范化形式。确立民族共同语的标准,推广民族共同语是政治、经济、文化发展的需要,是一个国家实现工业化、信息化、现代化的需要。新中国成立后,中国共产党、中央人民政府对汉民族共同语的确立和推广十分重视。1955年进行了现代汉语规范问题的讨论。1956年2月6日国务院发布了《关于推广普通话的指示》,明确提出并规定“汉语统一的基础已经存在了,这就是以北京语音为标准音,以北方话为基础方言,以典范的现代白话文著作为语法规范的普通话。”1958年周恩来总理在《当前文字改革的任务》中又把推行汉语拼音方案、推广普通话作为两项重要的任务。国家根据当时的情况,制定了“大力提倡,重点推行,逐步普及”的推广普通话的方针。1982年《中华人民共和国宪法》明确规定“国家推广全国通用的普通话”。
本书旨在构建普通话水平测试理论框架,提高普通话水平测试信息化的水平,完善普通话测试体系,满足社会对语言文字发展的需求。本书吸纳了各有关学科内容,经多次研究和实验有较高学术价值及实用性,其内容反映了目前国内该研究领域中具有领先水平的研究成果。
第一章 语言信息处理与普通话水平测试概述 第一节 语言信息处理 第二节 普通话水平测试第二章 普通话水平测试的语言统计研究 第一节 统计语言学的基本原理和方法 第二节 汉语普通话的语言概率 第三节 普通话测试内容的语言统计研究第三章 普通话水平测试的语音实验研究 第一节 实验语音学的基本原理和方法 第二节 普通话元音的声学特征与正误辨析 第三节 普通话辅音的声学特征与正误辨析 第四节 普通话韵律的声学特征与正误辨析第四章 普通话水平测试的教育统计与教育测量研究 第一节 教育测量学的基本原理和方法 第二节 普通话水平测试的教育测量理论 第三节 普通话水平测试的教育测量标准第五章 普通话水平测试数据库建设 第一节 数据库与数据库设计 第二节 普通话水平测试各等级标准语言特征数据库系统 第三节 普通话水平测试题库系统 第四节 计算机辅助普通话水平测试评分系统研究第六章 普通话水平测试的质量评析与改进实验研究 第一节 普通话水平测试的质量评析与改进 第二节 普通话水平测试的改进实验研究参考书目附录 一 普通话水平测试等级标准(试行) 二 普通话水平测试大纲 三 普通话水平测试样卷及答案数据 四 普通话水平测试题库系统自动出题程序 五 计算机辅助普通话水平测试人机对话评分系统主程序
插图:语言的概率,指的是构成整个语言系统的各种结构要素在使用频率方面所呈现出来的随机性与出现频率相关的可能性。语言符号在使用频率上既有很强的随机性,又有一定的必然性。充分利用语言概率进行语言信息处理,可以使我们在较短的时间内达到尽可能大的语言交际、语言教学和语言测试效果。就汉语而言,语言信息处理又叫中文信息处理,包括汉字信息处理和汉语信息处理两个部分。中文信息处理,是自然语言信息处理的一个分支。现阶段的中文信息处理技术,虽有了很大的发展,但离现代化的要求还有较大的差距。许多语言信息处理技术,既需要计算机技术的不断发展,更需要从语言信息处理的角度加强对汉语本身的研究。目前,汉语信息处理在机器翻译、汉语的人机对话和中文情报检索等方面,已经取得了一定的成果。汉语信息处理,还包括言语统计、计算机辅助语言教学(编制各种语言教学软件)、汉语语音识别和言语合成、汉语照排系统、方言研究、修辞学研究(用统计的方法研究风格特征,并进行风格比较)等。四语文现代化与语言信息处理语言文字是一个国家主权的象征,也是民族自信心的体现。语言文字是一个民族团结的象征。语言文字是一个民族文化传统的标志。现在世界上的各个国家、民族都比以往任何时候更加珍视自己的语言文字所具有的标志性意义。语言文字是交流的工具,也是文化的载体,承载着丰富、厚重的社会文化信息,服务于社会的经济、政治和文化,是能够产生社会效益和政治、经济、文化、科技等效益的特殊社会资源,是国家最宝贵的财富。语言是人类重要的文化资源和经济资源。当今时代,语言已经进入到经济和高新科技领域,成为经济发展的重要资源。随着信息时代的发展,语言作为经济资源的性质会体现得越来越明显,其经济意义越来越显著。语言是人类最重要的交际工具,也是人类最重要的信息载体和信息处理工具。人类历史上的每一次信息革命都与语言息息相关,都使语言的表现产生了新的形式。从语言的本体来看,有声语言的产生是人类第一次信息革命,这是一次人类信息手段的根本性的革命。文字的产生是第二次信息革命,文字的出现使语言除了口语形式外又多了书面语的形式。造纸和印刷术的产生是第三次信息革命,这次革命的成果使得语言能够以纸的形式记录下来并得到传播,从而产生了中华民族光辉灿烂的物质文明和精神文明。通信技术的产生和发展是第四次信息革命,这次革命的成果使得语言能够以光、电、磁的形式记录下来,并得到广泛的传播,有力地推动了现代科学技术的发展。计算机的出现和发展是第五次信息革命,这次革命对语言进行数字化加工,极大地扩充了语言的各种功能。
《语言信息处理与普通话水平测试》:云南师范大学重点学科建设经费资助
无