第一图书网

中文文本信息处理的原理与应用

苗夺谦,卫志华 编著 清华大学出版社
出版时间:

2007-9  

出版社:

清华大学出版社  

作者:

苗夺谦,卫志华 编著  

页数:

321  

Tag标签:

无  

内容概要

本书是一本全面系统地介绍中文文本信息处理的教材,内容丰富,由浅入深地讲述了中文文本信息处理的原理与应用。本书不仅介绍了基于规则的自然语言分析方法,也介绍了基于统计学的方法。全书共分为四大部分,分别是词法分析、语法处理、语义分析和应用与技术。其中前三部分是自然语言处理的基本理论,第一部分针对中文处理中特有的分词问题,介绍了自动分词算法、分词中歧义的消除和未登录词的识别算法,另外还介绍了语料库的相关知识。第二部分和第三部分都是从语法(语义)的表示入手,将自然语言形式化,再给出语法(语义)分析的算法,并针对该过程中的歧义问题给出了一些成熟的解决方案。最后一部分讲述自然语言理解在信息检索、信息抽取、自动文摘和文本分类等领域的应用。本书思路清晰,在每部分及每章的开始都介绍了该部分知识与其他部分之间的关系,以及该部分的知识点之间的关系,以帮助读者从整体上把握中文文本信息处理的思路,并能根据不同的需求或不同的问题选择适当的算法。  本书涉及内容广泛,能满足不同水平读者群的需求,可以作为计算机、信息类高年级本科生的教材,也可作为自然语言处理方向研究生的教材,也非常适合作为自然语言处理应用领域的研究人员和技术人员的参考资料。

书籍目录

第1章 概论 1.1 自然语言处理与中文信息处理 1.2 自然语言处理的新趋势 1.3 本书内容组织第一部分 词法分析 第2章 自动分词  2.1 关于自动分词  2.2 分词词典  2.3 机械分词方法 第3章 分词歧义消解  3.1 关于分词歧义  3.2 基于规则的分词消歧  3.3 基于统计方法的分词消歧 第4章 未登录词获取  4.1 关于未登录词  4.2 基于统计学的未登录词获取方法  4.3 中文姓名的自动辨识  4.4 中文统计词汇获取  4.5 无词典分词方法 第5章 语料库的构建  5.1 关于语料库  5.2 汉语语料库的基本加工规范  5.3 建设语料库的其他问题 第一部分习题第二部分 语法处理 第6章 自动标注  6.1 关于自动标注  6.2 马尔可夫模型和隐马尔可夫模型  6.3 马尔可夫模型标注器   6.4 隐马尔可夫模型标注器 第7章 语法表示  7.1 关于语法表示  7.2 形式语法描述  7.3 短语结构语法  7.4 转移网络  7.5 短语结构与句法树 第8章 语法分析  8.1 关于语法分析  8.2 基于符号串的句法分析  8.3 自底向上的图句法分析  8.4 自顶向下的图句法分析  8.5 基于转移网络的句法分析  8.6 移进归约句法分析器  8.7 概率上下文无关文法分析 第二部分习题第三部分 语义分析 第9章 语义表示  9.1 关于语义表示  9.2 语义的逻辑表示方法  9.3 论旨角色  9.4 语义网络表示法  9.5 框架表示法  9.6 量词的处理 第10章 语义分析  10.1 关于语义分析  10.2 组合理论与语义解释  10.3 基于语义特征的解释方法  10.4 基于语法关系的语义分析  10.5 语义语法  10.6 模板匹配  10.7 语义驱动的分析技术 第11章 语义消歧  11.1 关于语义歧义   11.2 选择限制法消歧  11.3 语义网络  11.4 统计词义消歧  11.5 统计语义优选 第三部分习题第四部分 应用与技术 第12章 文本分类  12.1 关于文本分类  12.2 文本分类方法  12.3 文本分类的评测 第13章 信息检索  13.1 关于信息检索  13.2 基于统计学的信息检索模型  13.3 基于语义的信息检索  13.4 典型信息检索系统  13.5 信息检索技术前沿 第14章 信息抽取  14.1 关于信息抽取  14.2 半结构化文本的信息抽取技术  14.3 典型信息抽取系统  14.4 Web信息抽取 第15章 自动文摘  15.1 关于自动文摘  15.2 自动文摘的方法  15.3 自动文摘系统的评测  15.4 自动文摘系统 第四部分习题参考文献


图书封面

图书标签Tags

广告

下载页面


中文文本信息处理的原理与应用 PDF格式下载



这本书写的不错,我已看过多次了,适合自然语言初学者的确是本好书。


这本书很适合信息管理、情报学专业同学好好学习的。


本书难度不小,适合有时间钻研的朋友。


不错 是很新 是正版吧 反正和我们老师用的一模一样


抄也就算了,抄了也不好好组织一下!


由于市场上这类书比较少,所以可以说开卷有益吧!书还是有点偏理论,对于像我这样没有基础的学习者挺合适的。


很水的一本书,还不如买本《统计自然语言处理基础》来看看


还没来得及细看,粗粗翻了一下,还不错


这本书的作者我认识,同济计算机系的一位知名教授.可是书中大段大段抄袭别人的内容,让读者很不爽.如果没有中文文本处理/自然语言处理基础的读者可以买一本看看.


介绍了各种方法,没有深入研究


信息处理方面很不错的教材


这本书还可以,讲解较为全面,作为入门教材比较可以。


介绍的太范,太浅


相关图书