第一图书网

口语机器翻译

瑞诺尔,卡特尔,布伊隆 等编 北京大学出版社
出版时间:

2010-8  

出版社:

北京大学出版社  

作者:

瑞诺尔,卡特尔,布伊隆 等编  

页数:

337  

字数:

388000  

Tag标签:

无  

前言

  计算语言学(Computational Lingljistics,CL)在语言科学与信息科学的研究领域扮演关键性的角色。语言学理论寻求对语言现象规律性的揭示与完整的解释。计算语言学正好提供了验证与应用这些规律与解释的大好机会。作为语言学、信息科学乃至于心理学与认知科学结合的交叉学科,计算语言学更提供了语言学基础研究与应用研究的绝佳界面。事实上,计算语言学与人类语言科技(Human Langllage Technology,HLT)可以视为一体两面,不可分割。  计算语言学研究滥觞于上世纪五六十年代的机器翻译研究。中文的相关研究也几乎同步开始,1960年起在柏克莱加州大学研究室,王士元、邹嘉彦、C.Y.Dougherty等人已开始研究中英、中俄机器翻译。他们的中文计算语言学研究,可说是与世界最尖端科技同步的。中国国内中俄翻译研究也不遑多让,大约在上世纪50年代中期便已开始。可惜的是,这些中文相关早期机器翻译研究,由于硬件与软件的限制,没能延续下来。中文计算语言学研究比较有系统的进展,还要等到1986年;海峡两岸在同一年成立了两个致力于中文计算语言学基础架构建立的研究群。北京大学的计算语言学研究所在朱德熙先生倡导下成立,随后一段时间由陆俭明、俞士汶主持。而台湾“中研院”的中文词知识库小组,由谢清俊创立,陈克健主持,黄居仁1987年返台后加入。

内容概要

口语翻译(Spoken Language Translation, SLT)是指让计算机实现从一种语言的语音到另一种语言的语音自动翻译的过程。其理想目标是,让计算机像人一样充当持不同语言的说话人之间的翻译角色。会议演讲、交谈(通过电话、网络或面对面)、广播等场景下的话语翻译都是口语翻译应用的重要领域。由于多数情况下说话人的话语都以口语风格为主,人们尤其希望翻译系统可以接受并实现任意口语化的、自由交谈式的对话语音直接翻译。本书全面、系统地介绍了SLT项目研究的主要成果,内容包括语言处理与语料收集、语言覆盖性、语音处理和系统评估等各个方面,其中语言处理部分是本书的主要内容。

书籍目录

导读PrefaceAcknowledgements 1 IntroductionPart 1 Language Processing and Corpora 2 Translation Using the Core Language Engine 3 Grammar Specialisation 4 Choosing among Interpretations 5 The TreeBanker 6 Acquisition of Lexical Entries 7 Spelling and Morphology 8 Corpora and Data CollectionPart 2 Linguistic Coverage 9 English Coverage 10 French Coverage 11 Swedish Coverage 12 Transfer Coverage 13 Rational Reuse of Linguistic DataPart 3 Speech Processing 14 Speech Recognition 15 Acoustic Modelling 16 Language Modelling for Multilingual Speech Translation 17 Porting a Recogniser to a New Language 18 Multiple Dialects and Languages 19 Common Speech/Language IssuePart 4 Evaluation and Conclusions 20 Evaluation 21 ConclusionsReferencesIndex

章节摘录

  棒性和系统的自适应能力。同书面语相比,口语的声学特性有一定的特殊性,这类语音的基频、时长、幅度等特征都随表达内容、感情色彩等不同,变化的范围比朗读语音大得多,同时还有非语声信号和噪声,充分研究这些特性,建立精细的声学模型非常重要。而且,讲话人往往是在较强的背景噪声或多讲话人环境下发音的,如果是电话自动语音翻译系统,还存在通讯干扰等其他因素的影响,因此,提高语音识别在不同说话人、不同声学环境及通道条件下的鲁棒性,在口语翻译系统中尤其重要。另外,在语言学层面,口语句子中含有大量的修正、重复、口头语、省略等非规范语言现象,研究这些特征,对语言模型进行完善,包括建模、算法和训练等各个方面,将有助于提高语音识别的正确率。  (2)翻译方法有待于进一步研究。尽管统计翻译方法具有较高的鲁棒性,但是,对非规范语言现象和噪声的处理能力仍然十分有限,而且这种方法与训练语料的规模和质量密切相关。统计方法与规则方法的结合一直是人们所追求的,但是具体如何融合,多翻译引擎以什么样的集成方式可以获得最好的系统性能,统计模型赖以训练的语料规模达到多大才算充分,非语言信息(手势、表情、说话人角色等)如何融人翻译模型等,诸多问题都远远没有得到解决。  ……


图书封面

图书标签Tags

广告

下载页面


口语机器翻译 PDF格式下载



相关图书