语音识别理论与实践(普通高等教育人工智能专业系列教材)

语音识别理论与实践(普通高等教育人工智能专业系列教材)
作者: 莫宏伟
出版社: 中国水利水电
原售价: 42.00
折扣价: 29.90
折扣购买: 语音识别理论与实践(普通高等教育人工智能专业系列教材)
ISBN: 9787522619026

作者简介

内容简介

  • 作者: 莫宏伟 编
  • 著: 莫宏伟 编
  • 装帧: 平装
  • 印次: 1
  • 定价: 42.00
  • ISBN: 9787522619026
  • 出版社: 中国水利水电出版社
  • 开本: 16开
  • 印刷时间: 暂无
  • 语种: 暂无
  • 出版时间: 2023-10-01
  • 页数: 188
  • 外部编号: 1203152927
  • 版次: 1
  • 成品尺寸: 暂无
  • 前言

    第1章 绪论

    1.1 语音识别简史

    1.1.1 语音识别早期探索

    1.1.2 概率模型一统江湖

    1.1.3 神经网络异军突起

    1.1.4 商业应用推波助澜

    1.2 国内发展现状

    1.3 语音识别框架

    1.3.1 经典方法

    1.3.2 概率模型

    1.3.3 深度神经网络-隐马尔可夫(DNN-HMM)模型

    1.3.4 端到端语音识别

    1.4 开源工具与数据集

    1.4.1 深度学习框架

    1.4.2 开源工具

    1.4.3 数据集

    本章小结

    课后习题

    第2章 语音基础知识

    2.1 语音信号基础

    2.1.1 声波的特性

    2.1.2 声音的采集装置

    2.1.3 声音的采样

    2.1.4 声音的量化

    2.1.5 语音的编码

    2.2 声学特征提取

    2.2.1 预处理

    2.2.2 傅里叶变换

    2.2.3 听觉特性

    2.2.4 线性预测

    2.2.5 倒谱分析

    2.2.6 声学特征

    本章小结

    课后习题

    第3章 声学模型

    3.1 高斯混合模型

    3.1.1 概率统计

    3.1.2 高斯分布

    3.1.3 GMM的组成和表示

    3.2 隐马尔可夫模型

    3.2.1 隐马尔可夫模型基本概念

    3.2.2 隐马尔可夫模型的定义

    3.2.3 隐马尔可夫模型的三个基本问题

    3.3 高斯混合模型-隐马尔可夫模型

    3.4 基于隐马尔可夫模型的语音识别

    3.4.1 建模单元

    3.4.2 发音过程与隐马尔可夫模型状态

    3.4.3 串接隐马尔可夫模型

    本章小结

    课后习题

    第4章 语言模型

    4.1 n-gram模型

    4.2 评价指标

    4.3 平滑技术

    4.3.1 Good-Turing折扣法

    4.3.2 Jelinek-Mercer插值法

    4.3.3 Kneser-Ney插值法

    4.3.4 Katz回退法

    4.4 语言模型的训练

    4.5 预训练语言模型

    4.5.1 基于自回归语言模型的预训练技术

    4.5.2 基于自编码语言模型的预训练技术

    4.5.3 基于序列到序列语言模型的预训练技术

    4.5.4 基于前缀语言模型的预训练技术

    4.5.5 基于排列语言模型的预训练技术

    4.5.6 预训练技术的改进方法

    本章小结

    课后习题

    第5章 加权有限状态解码器

    5.1 基于动态网络的Viterbi解码

    5.2 加权有限状态转换器理论

    5.2.1 基本概念

    5.2.2 半环

    5.3 HCLG构建

    5.3.1 语料准备

    5.3.2 构建语法模型

    ……

    第6章 深度神经网络模型

    第7章 端到端语音识别

    第8章 Kaldi实战

    第9章 语音交互系统

    参考文献

    附录 课后习题答案