登录 | 注册 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
基于深度神经网络的语音识别研究
  • 摘要

    目前,普通话与汉语方言语音识别主要采用的是三音素的隐马尔可夫模型,其语音识别率并不是很高.以Kaldi为测试平台,通过训练得到一个含有6个隐层的深度神经网络模型,利用该模型对普通话与四川话方言分别进行语音识别.实验结果表明,深度神经网络在普通话语料库中的语音识别性能要优于三音素的隐马尔可夫模型,词错率降低11.2%.而在四川话方言语料库训练集上的识别率与三音素的隐马尔可夫模型相当.

  • 作者

    黄威  石佳影  HUANG Wei  SHI Jia-yin 

  • 作者单位

    四川大学软件学院,成都,610065

  • 刊期

    2016年7期

  • 关键词

    深度神经网络  语音识别  隐马尔可夫 

相似文献 查看更多>>
3.215.182.81