第一图书网

说话人识别模型与方法

吴朝晖,杨莹春 著 清华大学出版社
出版时间:

2009-3  

出版社:

清华大学出版社  

作者:

吴朝晖,杨莹春 著  

页数:

329  

Tag标签:

无  

前言

说话人识别属于生物特征识别技术的一种,是一项根据语音波形中反映说话人生理和行为的特征的语音参数,自动识别说话人身份的技术。与语音识别不同的是,说话人识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性;而语音识别的目的是识别出语音信号中的言语内容,并不考虑说话人是谁,它强调共性。说话人识别技术的崛起得益于信号检测与处理、模式识别、人工智能、机器学习等理论与技术的发展,这是一个涉夏生理学、心理学、声学、语音学等多学科的研究领域。本书结合我们对说话人识别进行的研究和工作,在对说话人识别的基本概念和方法进简要介绍的基础上详细介绍了我们在测试语料库、特征组合、特征变换、识别模型以及应用系统开发的最新重要研究成果。我们从事说话人识别研究至今已8年有余,简单回顾下作者与本书写作内容有关的几个重要时间标记。1999年,在杭州中正生物认证有限公司的资助下,我们的生物认证实验室宣告成立。

内容概要

说话人识别是根据语音波形中反映说话人生理和行为的特征的语音参数,自动识别说话人身份的技术。本书作者结合多年的科研丁作,分5个部分介绍了说话人识别的基本概念、方法以及最新研究进展。第1部分概括介绍说话人识别的主要概念、基本原理、研究历史与现状,以及测试语料库的构建;第2部分介绍作者对特征提取提出的不同改进方法,包括特征组合与特征变换;第3部分是作者提出的新的说话人识别模型,包括支持向量机、动态贝叶斯网络、主成分分析;第4部分介绍作者在基于信息融合的说话人识别上的创新工作;第5部分介绍作者开发的一个软件平台及其基础上的两个具体应用系统,最后是全书总结并展望发展趋势。  本书可供信息工程、电子工程、计算机科学与技术、公安、军事侦察等领域的科技工作者参考,也可以作为高等院校信号与信息处理、通信与电子系统、模式识别、生物医学等学科专业的研究生或高年级本科生的教学参考书。

书籍目录

第一篇 绪论 第1章 背景与概述   1.1 研究背景及意义   1.2 研究进展与趋势   1.3 本书结构  参考文献  第2章 技术基础与理论   2.1 背景知识   2.2 说话人识别系统结构   2.3 特征提取   2.4 说话人识别模型   2.5 得分规整   2.6 系统性能评价   2.7 小结  参考文献  第3章 说话人识别语料库   3.1 常用语料库   3.2 面向移动互联环境的说话人识别语料库(SRMC)   3.3 电话语音库(PHONE)  3.4 多模态说话人识别库  3.5 NOISEX-92数据库  3.6 小结 参考文献第二篇 特征提取 第4章 说话人特征分析与优化 4.1 特征性能分析  4.2 特征参数优化  4.3 特征组合  4.4 二次特征提取  4.5 小结  参考文献 第5章 基于主成分分析(PCA)的说话人特征变换  5.1 高维说话人特征的缺陷  5.2 说话人特征与PCA变换  5.3 PCA特征变换应用于说话人鉴别  5.4 局部PCA特征变换  5.5 全局PCA特征普换  5.6 基准系统、局部PCA变换与全局PCA变换的比较  5.7 小结  参考文献 第6章 基于线性判别分析(LDA)的说话人特征变换  6.1 LDA变换与PCA变换的联系与区别  6.2 LDA特征变换  6.3 基准系统、全局PCA变换与LDA变换的比较  6.4 小结 第7章 基于轨线模型的说话人特征时序性发掘第三篇 识别模型 第8章 基于支持向量机的识别模型 第9章 基于动态贝叶斯网络的识别模型 第10章 基于主成分分析分类器的说话人识别第四篇 信息融合 第11章 声门信息融合 第12章 人脸信息融合第五篇 应用展望 第13章 支持说话人识别研究与开发的开放式平台SONAR  第14章 应用系统 第15章 总结与展望

章节摘录

插图:第一篇 绪论第1章 背景与概述1.1 研究背景及意义1.1.2 说话人识别的优势与应用前景与其他生物认证技术如指纹识别、掌形识别、虹膜识别等一样,声纹识别有不会遗失、无须记忆和使用方便等优点。在生物认证技术领域中,说话人识别技术以其独特的方便性、经济性和准确性受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式。在众多的生物认证技术中,说话人识别技术表现出很多应用上的优势。首先,说话人识别有着天然的优点:以声音作为识别特征,因其非接触性和自然性,用户容易接受。在说话人识别中,用户不用刻意地将手指放在传感器上,或者把眼睛凑向摄像头,只需要简单地说一两句话即可完成识别。其次,说话人识别所用的设备成本很低。对输入设备如麦克风、电话送话器等没有特别的要求;声音的采样与量化对芯片的要求也不高;特征提取、模型训练和匹配只需普通计算机即可完成。另外,因为普遍存在的电话网络和麦克风、计算机的一体化,所以说话人识别系统所需的硬件成本几乎为零。再次,其他生物特征识别技术各有其比较劣势。指纹识别技术虽然已经比较成熟,但用户的接受度不高,人们经常把指纹同犯罪联系在一起,不卫生是另外一个不利因素。虹膜、视网膜识别技术的精确度虽然很高,但所需的设备非常昂贵,并且据研究,这些特征中包含用户的健康状况等隐私信息,大众接受度也不高。脸部、步法等特征,虽然比较自然,用户也容易接受,但实现难度很大。因此,说话人识别的优势更加明显。


编辑推荐

《说话人识别模型与方法》可供信息工程、电子工程、计算机科学与技术、公安、军事侦察等领域的科技工作者参考,也可以作为高等院校信号与信息处理、通信与电子系统、模式识别、生物医学等学科专业的研究生或高年级本科生的教学参考书。

图书封面

图书标签Tags

广告

下载页面


说话人识别模型与方法 PDF格式下载



作为国内不多的说话者识别的专著,一直想买本翻翻,书的内容不错,就是稍微有些破损,希望卓越以后发书时能再仔细点,但是总体来讲瑕不掩瑜。


说话人识别模型与方法


一开始看这本书目录写的蛮好的,买了之后才发现,如果按照目录所列的东西详细讲的话,这本书会很厚。但恰恰相反的是,这本书很薄,里面的东西你看的话,会发现基本上都是网上的一些原理粘合而成的,所以我个人推荐大家不要买,要学习的话还是去买那本模式分类(Pattern Classification)中文版或者英文版吧,中文翻译的也很好,实在不推荐这本书,你学不到什么深点的东西。


相关图书