音频信息检索理论与技术
2011-3
科学出版社
韩纪庆 等 著
256
无
《音频信息检索理论与技术》系统地介绍语音检索研究的相关理论、技术与方法,以及该学科领域取得的新进展。内容将涉及基于语音内容的信息检索、基于说话人特征的信息检索、基于音频及音乐特征的信息检索等范畴。《音频信息检索理论与技术》将从语音检索的理论框架、适合检索要求的语音特征表示、高效索引的构建、高速搜索算法、典型的实用技术,以及典型应用实例等方面系统地介绍语音检索相关的理论与技术。
前言第一部分 音频信息检索的发展与理论基础第1章 绪论1.1 信息检索技术的分类及进展1.1.1 概述1.1.2 文本信息检索1.1.3 多媒体信息检索1.2 音频信息检索技术的发展1.2.1 语音文档检索1.2.2 说话人检索1.2.3 音乐检索1.3 音频信息检索的应用1.4 本书的构成参考文献第2章 音频信息检索的基础2.1 人类对音频信息的认知机理2.1.1 听觉的生理基础2.1.2 听觉的感知机制2.1.3 听觉特性2.2 音频信号的数字处理及特征表示2.2.1 信号的统计特征2.2.2 感知特征2.3 音频信息检索框架及模型2.4 音频信息检索的评价参考文献第二部分 表示级的音频检索第3章 基于直接匹配的音频样例检索方法3.1 基于分段的实时检索方法3.1.1 片段划分3.1.2 基于检索窗的检索控制3.1.3 基于分段的检索方法3.1.4 快速分段检索方法3.2 MPEG-1压缩域模糊分类的检索方法3.2.1 MPEG音频编码简介3.2.2 MPEG-1压缩域特征选择和提取3.2.3基于MPEG-1压缩域模糊分类的检索方法参考文献第4章 基于索引的音频样例检索方法4.1 局部敏感哈希索引方法4.1.1 局部敏感哈希4.1.2 ρ-稳定分布局部敏感哈希4.1.3 ρ-稳定分布局部敏感哈希音频索引方法4.2 基于局部敏感哈希倒排索引的检索方法4.2.1 基于局部敏感哈希的倒排索引构造4.2.2 基于局部敏感哈希倒排索引的搜索4.3 基于树与链表混合索引的检索方法4.3.1 模糊直方图模型4.3.2 树与链表混合索引构造4.3.3 基于树与链表混合索引的搜索4.3.4 时间复杂度分析参考文献第5章 基于GPU通用计算的快速音频样例检索方法5.1 通用图形处理器与统一计算设备框架5.1.1 通用图形处理器5.1.2 统一计算设备框架5.2 检索算法GPU加速的可行性分析5.2.1 检索算法可移植性分析5.2.2 检索算法计算特点分析5.3 检索算法GPU加速的实现5.3.1 以线程为粒度的算法实现5.3.2 以线程块为粒度的算法实现5.3.3 加速效果比较参考文献第三部分 语义级语音文档检索第6章 语音文档检索的预处理技术6.1 语音文档检索系统的组成6.2 检索系统中的预处理技术6.2.1 连续语音识别6.2.2 关键词检出6.3 语音文档检索的评价指标参考文献第7章 语音文档检索的索引和搜索技术7.1 基于关键词检出的检索方法7.2 基于语音识别器最优候选的检索方法7.2.1 基于大词表连续语音识别器最优候选的检索方法7.2.2 基于子词识别器最优候选的检索方法7.3 基于音节网格搜索的检索方法7.3.1 音节网格的若干定义及性质7.3.2 基于音节网格搜索的检索方法7.3.3 索引去冗余方法7.3.4 检索性能分析7.4 基于音节倒排索引的检索方法7.4.1 倒排索引结构7.4.2 采用时间匹配机制的检索方法7.4.3 采用位置匹配机制的检索方法7.4.4 检索性能分析7.5 基于后验概率邻接音节矩阵的检索方法7.5.1 语音文档的表示7.5.2 网格的邻接音节后验概率矩阵7.5.3 语音文档的邻接音节后验概率矩阵7.5.4 检索方法描述7.5.5 基于韵律加权的索引修正7.5.6 检索性能分析参考文献第8章 语音文档检索中的容错技术8.1 基于模糊匹配策略的容错方法8.2 基于融合策略的容错方法8.2.1 索引层面的融合8.2.2 分数层面的融合8.3 基于扩充网格的容错方法8.3.1 算法的基本思想8.3.2 基于局部路径的简化计算8.3.3 基于扩充网格的检索精度提高方法8.3.4 检索性能分析8.4 基于词片语言模型的容错方法8.4.1 词片8.4.2 基于互信息的词片选择算法8.4.3 基于词片的语言模型8.4.4 采用词片识别器的检索方法参考文献第四部分 语义级的说话人检索第9章 说话人检索9.1 说话人分割9.2 检索中的说话人识别技术9.2.1 基于GMM的识别方法9.2.2 基于GMM-UBM的识别方法9.3 直接利用说话人识别实现的检索技术9.3.1 极低错误接受率的实现9.3.2 训练语料不充分问题的解决9.4 间接利用说话人识别实现的检索技术9.4.1 锚模型索引方法9.4.2 GMM模型索引方法参考文献第五部分 语义级的音乐检索第10章 音乐自动标注10.1 音乐声学基础10.1.1 乐音的感知10.1.2 音程、音律、音名与音高标准10.1.3 音乐的要素10.2 音乐自动标注方法及存在的问题10.3 基于谐波结构信息的音乐标注10.3.1 基于BP神经网络的起始点检测10.3.2 基于谐波结构信息的多基频估计方法10.4 基于半音域频率系数的歌曲旋律提取10.4.1 半音域频率系数10.4.2 基于viterbi方法的旋律提取参考文献第11章 音乐检索11.1 哼唱检索11.1.1 基于规则的哼唱旋律提取11.1.2 乐曲库的索引方法11.1.3 旋律匹配11.2 拍打检索11.2.1 特征提取11.2.2 基于DTW的匹配计算11.3 基于色度图的复调音乐检索11.3.1 色度11.3.2 色度图11.3.3 离散色度图和色度特征11.3.4 基于色度的相关计算与检索参考文献
无