成功加入购物车

去购物车结算 X
倒爷图书专营店
  • 语音识别(原理与应用) 9787121385025

语音识别(原理与应用) 9787121385025

举报

全新正版 可开票 支持7天无理由,不清楚的请咨询客服。

  • 作者: 
  • 出版社:    电子工业
  • ISBN:    9787121385025
  • 出版时间: 
  • 装帧:    其他
  • 开本:    其他
  • 作者: 
  • 出版社:  电子工业
  • ISBN:  9787121385025
  • 出版时间: 
  • 装帧:  其他
  • 开本:  其他

售价 65.82 5.1折

定价 ¥128.00 

品相 全新

优惠 满包邮

优惠 满减券
    运费
    本店暂时无法向该地区发货

    延迟发货说明

    时间:
    说明:

    上书时间2024-01-24

    数量
    库存2
    微信扫描下方二维码
    微信扫描打开成功后,点击右上角”...“进行转发

    卖家超过10天未登录

    • 商品详情
    • 店铺评价
    手机购买
    微信扫码访问
    • 货号:
      30909628
      商品描述:
      目录
      第1章  语音识别概论1
      1.1  语音的产生和感知1
      1.2  语音识别过程4
      1.3  语音识别发展历史8
      1.4  国内语音识别现状15
      1.5  语音识别建模方法19
      1.5.1  DTW19
      1.5.2  GMM-HMM20
      1.5.3  DNN-HMM20
      1.5.4  端到端22
      1.6  语音识别开源工具22
      1.7  语音识别常用数据库22
      1.8  语音识别评价指标24
      1.9  参考资料24
      第2章  语音信号基础28
      2.1  声波的特性28
      2.2  声音的接收装置29
      2.2.1  麦克风阵列31
      2.3  声音的采样32
      2.4  声音的量化33
      2.5  语音的编码35
      2.6  WAV文件格式38
      2.7  WAV文件分析39
      2.8  本章小结42
      思考练习题43
      第3章  语音特征提取44
      3.1  预处理44
      3.2  短时傅立叶变换48
      3.3  听觉特性51
      3.4  线性预测54
      3.5  倒谱分析55
      3.6  常用的声学特征56
      3.6.1  语谱图57
      3.6.2  FBank58
      3.6.3  MFCC59
      3.6.4  PLP61
      3.6.5  CQCC62
      3.7  本章小结65
      思考练习题66
      第4章  HMM67
      4.1  HMM的基本概念69
      4.1.1  马尔可夫链70
      4.1.2  双重随机过程71
      4.1.3  HMM的定义72
      4.2  HMM的三个基本问题73
      4.2.1  模型评估问题74
      4.2.2  最佳路径问题77
      4.2.3  模型训练问题79
      4.3  本章小结81
      4.4  参考资料82
      思考练习题82
      第5章  GMM-HMM83
      5.1  概率统计84
      5.2  高斯分布85
      5.3  GMM88
      5.3.1  初始化89
      5.3.2  重估计90
      5.4  GMM-HMM91
      5.5  GMM-HMM的训练97
      5.6  模型自适应99
      5.6.1  MAP99
      5.6.2  MLLR100
      5.6.3  fMLLR100
      5.6.4  SAT101
      5.7  本章小结101
      5.8  参考资料101
      思考练习题102
      课程实践:基于HTK搭建GMM-HMM系统103
      第6章  基于HMM的语音识别104
      6.1  建模单元104
      6.2  发音过程与HMM状态107
      6.3  串接HMM108
      6.4  固定语法的识别112
      6.5  随机语法的识别117
      6.6  本章小结123
      思考练习题124
      第7章  音素的上下文建模125
      7.1  协同发音125
      7.2  上下文建模126
      7.3  决策树128
      7.4  问题集129
      7.4.1  手工设计129
      7.4.2  自动生成131
      7.5  三音子模型的训练134
      7.6  本章小结135
      思考练习题135
      第8章  语言模型136
      8.1  n-gram模型138
      8.2  评价指标——困惑度142
      8.3  平滑技术143
      8.3.1  Good-Turing折扣法143
      8.3.2  Jelinek-Mercer插值法144
      8.3.3  Kneser-Ney插值法144
      8.3.4  Katz回退法146
      8.4  语言模型的训练148
      8.5  递归神经网络语言模型151
      8.6  本章小结156
      8.7  参考资料156
      思考练习题157
      第9章  WFST解码器158
      9.1  基于动态网络的Viterbi解码159
      9.2  WFST理论163
      9.3  HCLG构建168
      9.3.1  H的构建169
      9.3.2  C的构建171
      9.3.3  L的构建172
      9.3.4  G的构建173
      9.3.5  HCLG合并175
      9.4  WFST的Viterbi解码177
      9.4.1  Token的定义177
      9.4.2  Viterbi算法178
      9.5  Lattice解码185
      9.5.1  主要数据结构185
      9.5.2  令牌传播过程186
      9.5.3  剪枝策略189
      9.5.4  Lattice190
      9.6  本章小结192
      9.7  参考资料192
      思考练习题193
      第10章  DNN-HMM194
      10.1  深度学习194
      10.2  DNN195
      10.2.1  激活函数196
      10.2.2  损失函数198
      10.2.3  梯度下降算法199
      10.3  DNN与HMM的结合201
      10.4  不同的DNN结构205
      10.4.1  CNN205
      10.4.2  LSTM210
      10.4.3  GRU210
      10.4.4  TDNN211
      10.4.5  TDNN-F214
      10.5  本章小结218
      10.6  参考资料219
      思考练习题219
      第11章  序列区分性训练220
      11.1  区分性准则221
      11.1.1  MMI221
      11.1.2  BMMI222
      11.1.3  MPE/sMBR222
      11.2  MMI求导过程223
      11.3  Lattice-based MMI225
      11.4  Lattice-free MMI227
      11.5  Kaldi Chain模型230
      11.6  本章小结231
      11.7  参考资料231
      思考练习题232
      第12章  端到端语音识别233
      12.1  CTC234
      12.1.1  损失函数235
      12.1.2  前向算法239
      12.1.3  后向算法242
      12.1.4  求导过程243
      12.1.5  CTC解码245
      12.2  RNN-T248
      12.3  Attention模型251
      12.4  Hybrid CTC/Attention254
      12.5  Transformer256
      12.6  本章小结259
      12.7  参考资料260
      思考练习题261
      第13章  Kaldi实践262
      13.1  下载与安装Kaldi263
      13.1.1  获取源代码263
      13.1.2  编译264
      13.2  创建与配置基本的工程目录265
      13.3  aishell语音识别工程266
      13.3.1  数据映射目录准备267
      13.3.2  词典准备和lang目录生成269
      13.3.3  语言模型训练271
      13.3.4  声学特征提取与倒谱均值归一化273
      13.3.5  声学模型训练与强制对齐274
      13.3.6  解码测试与指标计算277
      13.4  本章小结279
      第14章  Espnet实践280
      14.1  数据准备280
      14.1.1  映射文件准备280
      14.1.2  特征提取281
      14.1.3  数据增强282
      14.1.4  词典生成282
      14.1.5  数据打包283
      14.2  Espnet配置文件284
      14.3  语言模型训练285
      14.4  声学模型训练287
      14.4.1  声学模型训练脚本287
      14.4.2  CTC声学模型训练288
      14.4.3  Attention声学模型训练289
      14.4.4  RNN-T模型训练290
      14.4.5  Transformer模型训练292
      14.5  语音识别解码293
      14.6  Espnet训练解码可视化294
      14.6.1  Espnet训练参数可视化294
      14.6.2  Espnet中的Attention可视化295
      14.6.3  Espnet解码结果可视化296
      14.7  本章小结297
      14.8  参考资料297
      第15章  工业应用实践298
      15.1  动态库封装298
      15.1.1  函数接口298
      15.1.2  动态库编译306
      15.1.3  动态库调用309
      15.2  语音云平台310
      15.3  识别引擎优化315
      15.3.1  加快响应速度315
      15.3.2  定制语言模型316
      15.3.3  定制声学模型316
      15.4  嵌入式移植318
      15.5  本章小结319

      内容摘要
      本书系统地介绍了语音识别的原理和应用,全书共分15章,原理部分涵盖声学特征、隐马尔可夫模型(HMM)、高斯混合模型(GMM)、深度神经网络(DNN)、语言模型和加权有限状态转换器(WFST),重点描述了GMM-HMM、DNN-HMM和端到端(E2E)三种语音识别框架。本书应用部分包含Kaldi、Espnet、工业应用实践介绍,内容主要来自工程经验,极具实用性。 本书可以作为普通高等学校人工智能、计算机科学与技术、电子信息工程、自动化等专业的本科生及研究生教材,也适合作为从事智能语音系统的科研和工程技术人员的参考用书。

      配送说明

      ...

      相似商品

      为你推荐

    孔网啦啦啦啦啦纺织女工火锅店第三课

    开播时间:09月02日 10:30

    即将开播,去预约
    直播中,去观看