
作者:王晶,易伟明编著
页数:164页
出版社:北京理工大学出版社
出版日期:2023
ISBN:9787576328486
电子书格式:pdf/epub/txt
内容简介
本书包括12章。第1章绪论,简要介绍语音信号处理的应用、发展历程和语音信号的基本知识。第2章描述语音处理的基本原理,重点介绍对应于人类说话和听音过程的语音产生和感知模型,以及在数字语音信号处理中经常使用的两种技术:短时分析和基音估计。第3章介绍语音质量的主观和客观评价技术,并列出了一些常用的评价标准。第4章至第7章详细阐述了语音处理的一些关键技术,如线性预测分析、同态分析、矢量量化和隐马尔可夫模型,这些传统的处理技术对于语音乃至其他信号处理领域都有很好的学术研究和应用意义。第8章至第11章从应用角度分别讲解4个最常见的语音处理研究方向:语音编码、语音识别、语音增强和语音合成。第12章简要介绍了深度学习在语音信号处理的中的应用,主要包括基于深度学习的语音识别和语音增强技术。
作者简介
王晶,北京理工大学信息与电子学院副教授,博士生导师,曾为香港中文大学和美国俄亥俄州立大学访问学者,入选北京市高等学校青年人才计划,主要研究领域为语音和音频信号处理、多媒体通信、虚拟现实等,承担 自然科学基金、 科技重大专项、 智能制造专项、北京市自然基金等多项 和省部级课题。目前是 ISO/IEC JTC1 SC24/SC29专家委员,中国AVS数字音视频编解码标准组织专家成员、IEEE 会员、中国通信学会 会员、中国电子学会 会员、中国人工智能学会会员、中国计算机学会会员等。至今已发表SCI/EI检索学术论文60余篇,授权发明专利10余项,获得AVS产业技术创新奖,主持获批电子行业标准1项,主持研制虚拟现实音频 标准1项。
目录
第1章绪论
1.1概述
1.2语音信号数字处理的应用
1.3语音信号处理的发展历史
1.4认识语音信号
第2章语音信号处理基础
2.1语音的产生
2.2语音的感知
2.3短时分析技术
2.4基音周期估计
第3章语音质量评价技术
3.1语音质量评价技术概述
3.2语音质量主观评价技术
3.3语音质量客观评价技术
3.4语音质量评价技术的应用与发展
第4章线预测分析技术
4.1线预测分析基本概念
4.2线预测参数的估计
4.3基于线预测的频谱分析
4.4线预测等效参数
第5章同态分析技术
5.1同态系统
5.2倒谱和复倒谱
5.3同态滤波
5.4同态分析应用
第6章矢量量化技术
6.1量化的基本概念
6.2矢量量化的基本原理
6.3优矢量量化器的设计
6.4矢量量化方法分类
第7章隐马尔可夫模型
7.1隐马尔可夫模型的前期知识
7.2隐马尔可夫模型的基本概念
7.3隐马尔可夫模型的3个基本问题
7.4隐马尔可夫模型的特和类型
第8章语音编码
8.1语音编码概述
8.2语音编码分类
8.3语音编码关键技术
8.4语音编码能评价
第9章语音识别
9.1语音识别概述
9.2基本的语音识别系统
9.3语音关键词检测技术
9.4语音识别技术的挑战
第10章语音
10.1语音概述
10.2单通道语音
10.3麦克风阵列语音
10.4其他语音技术
第11章语音合成
11.1语音合成概述
11.2语音合成的关键技术
11.3基音同步叠接相加算法简介
11.4文语转换系统
第12章深度学处理技术
12.1深度学背景
12.2典型的神经网络概述
12.3深度学语音识别
12.4深度学语音
参考文献
1.1概述
1.2语音信号数字处理的应用
1.3语音信号处理的发展历史
1.4认识语音信号
第2章语音信号处理基础
2.1语音的产生
2.2语音的感知
2.3短时分析技术
2.4基音周期估计
第3章语音质量评价技术
3.1语音质量评价技术概述
3.2语音质量主观评价技术
3.3语音质量客观评价技术
3.4语音质量评价技术的应用与发展
第4章线预测分析技术
4.1线预测分析基本概念
4.2线预测参数的估计
4.3基于线预测的频谱分析
4.4线预测等效参数
第5章同态分析技术
5.1同态系统
5.2倒谱和复倒谱
5.3同态滤波
5.4同态分析应用
第6章矢量量化技术
6.1量化的基本概念
6.2矢量量化的基本原理
6.3优矢量量化器的设计
6.4矢量量化方法分类
第7章隐马尔可夫模型
7.1隐马尔可夫模型的前期知识
7.2隐马尔可夫模型的基本概念
7.3隐马尔可夫模型的3个基本问题
7.4隐马尔可夫模型的特和类型
第8章语音编码
8.1语音编码概述
8.2语音编码分类
8.3语音编码关键技术
8.4语音编码能评价
第9章语音识别
9.1语音识别概述
9.2基本的语音识别系统
9.3语音关键词检测技术
9.4语音识别技术的挑战
第10章语音
10.1语音概述
10.2单通道语音
10.3麦克风阵列语音
10.4其他语音技术
第11章语音合成
11.1语音合成概述
11.2语音合成的关键技术
11.3基音同步叠接相加算法简介
11.4文语转换系统
第12章深度学处理技术
12.1深度学背景
12.2典型的神经网络概述
12.3深度学语音识别
12.4深度学语音
参考文献















