第一图书网

现代汉字特征分析与计算研究

邢红兵 商务印书馆
出版时间:

2007-6  

出版社:

商务印书馆  

作者:

邢红兵  

页数:

225  

Tag标签:

无  

内容概要

  该书从汉字字形特征的统计属性研究出发,详细分析了汉字的特点及其使用情况,同时借助于数据库的方法,统计了五套小学语文教材的分布情况。在此基础上,结合心理学的实验研究结果,将这些知识运用到计算机模拟研究中,并对2万汉字进行完全表征。

书籍目录

上编 汉字的特征分析第一章 汉字的使用1.1 汉字的字量1.2 汉字字集1.2.1 “GB 13000.1字符集”1.2.2 现代汉语常用字表1.2.3 “现代汉语研究语料库系统”汉字1.2.4 小学语文教材汉字1.3 汉字的使用1.3.1 从小学语文教材看汉字的使用1.3.2 从语料库看汉字的使用第二章 汉字字形特征2.1 汉字的笔画2.1.1 汉字的笔形2.1.2 汉字的笔画数2.1.3 汉字笔画趋简率2.2 汉字的基础部件2.2.1 部件的类型2.2.2 基础部件的数量2.2.3 成字部件和非成字部件2.2.4 基础部件的构字能力2.2.5 基础部件的典型位置2.2.6 基础部件的构形2.3 汉字的构造2.3.1 汉字的结构类型2.3.2 汉字的结构层次2.3.3 汉字的构造第三章 汉字形声字声旁表音研究3.1 汉字的构字法3.2 形声字声旁表音的统计研究3.3 小学语文教材形声字表音情况分析3.3.1 小学语文教材形声字数据库的建立3.3.2 小学语文教材形声字数量3.3.3 小学语文教材形声字的使用3.3.4 小学语文教材形声字的家族3.3.5 小学语文教材形声字的表音特点第四章 形声字的认知研究4.1 早期的汉字认知研究4.2 80年代以后的汉字认知研究4.2.1 汉字的构成成分和汉字的正字法规则4.2.2 汉字的亚词汇加工4.2.3 汉字的语音意识4.2.4 儿童发展性阅读障碍4.3 形声字字音加工的认知研究4.3.1 形声字的规则性效应及其发展4.3.2 形声字的一致性效应及其发展下编 汉字的计算与模拟研究第五章 联结主义理论和自组织模型5.1 语言习得理论5.2 联结主义理论5.3 神经网络模型5.3.1 主要的神经网络模型5.3.2 神经网络的学习5.3.3 神经网络中的信息表征5.4 自组织理论5.4.1 自组织模型简介5.4.2 赫布学习法5.5 语言习得的自组织模型5.5.1 DISLFX及其相关研究5.5.2 DevLex及其相关研究5.6 汉字命名的计算机模拟研究5.6.1 模型的结构5.6.2 汉字字形字音的表征5.6.3 模型的模拟结果第六章 汉字表征研究6.1 汉字字形的表征方法6.1.1 前期研究6.1.2 汉字字形表征6.2 汉字字音的表征方法6.3 形声字字形的复合表征第七章 自组织模型的建造7.1 模拟软件DISLEX7.2 汉字表征数据库及表征程序7.2.1 汉字属性数据库7.2.2 基础部件属性数据库第八章 形声字命名的计算机模拟研究8.1 汉字输入、输出词典中字形、字音的储存方式8.1.1 主要术语和参数说明8.1.2 前期研究8.2 形声字命名模拟研究8.2.1 模型命名形声字的策略8.2.2 模型命名形声字的规则性效应及其发展8.2.3 模型命名形声字的一致性效应及其发展8.3 计算机模拟研究的本质特征8.3.1 语言材料库的建设及其在模型中的应用8.3.2 汉字的字形和字音的表征8.3.3 模型的知识获得和知识输出8.3.4 进一步的研究参考文献附录1:《信息处理用GB 13000.1字符集汉字部件规范》中的“基础部件表”附录2:部件视觉属性分组附录3:汉语音素表征方法及赋值表附录4:模型文件样例附录5:五年级模型命名不熟悉形声字测试材料附录6:模型命名形声字的规则性效应及其发展测试材料附录7:模型命名形声字的一致性效应及其发展测试材料后记

媒体关注与评论

  后记  从1990年开始,我就跟随我的硕士导师张普教授从事语言信息处理方面的研究工作,特别是汉字字形方面的研究工作,至今已积累了大量的数据库资源。这期间,我也参与了大量的语料库的建设与加工研究,并积累了一定的来源于语料库的相关统计数据,这些资源是我后一阶段汉字计算机模拟研究中的表征研究的基础。  从1998年开始,我进入北京师范大学心理学院学习,师从舒华教授,期间有幸能够到美国里士满大学进修,跟随李平教授学习计算机模拟研究。这期间我曾经利用将近一年的时间致力于汉字字形的表征研究,并将该研究成果运用到基于自组织模型的计算机模拟研究中。2002年发表的汉字计算机模拟研究的文章曾经获得过专门奖励在读研究生的马尔奖的提名奖。  2004年《认知科学杂志》(Journal of Cognitive Science)发表了我和舒华教授、李平教授合作的论文""The acquisition of Chinese characters:Corpus analyses and connectionist simulations"",审稿的专家和编辑都希望能够有专门的文章详细介绍关于汉字表征的方法。从2004年初开始,我就着手对这两方面的研究进行整理。至今已经完成,希望通过这本专著使更多的人能够了解汉字的字形特征和汉字计算机模拟研究,也希望更多的人能够关注汉字字形表征方法,并能够运用到相关研究之中。  本书分为两部分:汉字字形特征分析和汉字形声字命名的计算机模拟研究。这两部分内容也是笔者两个阶段主要研究成果的总结。上编的内容主要是基于统计的汉字属性研究,这部分内容主要来源于我十几年来汉字字形的研究积累,下编是在我的博士毕业论文的基础上写成的,特别是模拟研究,基本保持原貌。  本书的研究内容是一种跨学科的研究,能够取得这样的一点成绩,首先我要感谢我的导师张普教授,张先生不仅领着我走进了中文信息处理这个领域,我还跟随张先生在这个领域默默耕耘了十几年。我也要感谢我的博士导师舒华教授,舒先生眼界开阔、思维敏锐、治学严谨、为人正直,是我治学道路上永远的楷模。我要感谢美国里士满大学的李平教授,是他使我获得了将我积累的计算机资源应用到对我来说是一个全新的领域——计算机模拟研究的机会,我们面对面在餐桌上、在汽车里讨论着关于模型的训练方法和汉字字形的表征问题,那情景终生难忘。在那里,我不仅学到了计算机模型相关的知识,更重要的是开阔了眼界。  感谢商务印书馆为本书提供了出版的机会,感谢商务印书馆的周洪波先生在本书的修改和出版过程中给予的支持和帮助,感谢责任编辑余桂林先生认真细致地进行编辑工作。北京语言大学的王建勤教授对我的汉字表征研究和计算机模拟研究给予了高度的关注,并鼓励我将相关的内容整理出版。由于作者水平有限,不足之处在所难免,恳请读者批评指正。    邢红兵  2007年2月


图书封面

图书标签Tags

广告

下载页面


现代汉字特征分析与计算研究 PDF格式下载



相关图书