登录 | 注册 | 充值 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
小规模情感数据和大规模中性数据相结合的情感韵律建模研究
  • 摘要

    建立好的情感韵律模型是合成情感语音的重要环节,而在情感语音的研究过程中,一个必须面对的现实问题就是通常情感数据量相比于中性数据量要少得多.将一个含有高兴、生气、悲伤3种情感语音的小规模数据库和一个较大规模的中性语音数据库相结合,进行情感韵律建模研究.对影响情感的韵律参数进行了分析,建立了基于人工神经网络的情感韵律模型.针对情感数据量相对于中性数据量的不足而导致的过拟合现象,提出了3种解决办法,即混合语料法、最小二乘融合法和级联网络法.这些方法都在不同程度上扩大了情感语料的作用,使得情感预测效果都有所提高.尤其是级联网络法,将中性模型的结果作为级联网络的一个输入,相当于扩大了情感模型的特征空间,更加强化了情感模型各输入特征的作用,在3种情感的各韵律参数生成中效果是最好的.

  • 作者

    邵艳秋  穗志方  韩纪庆  王志伟  Shao Yanqiu  Sui Zhifang  Han Jiqing  Wang Zhiwei 

  • 作者单位

    北京大学计算语言学研究所,北京,100871/哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001

  • 刊期

    2007年9期 ISTIC EI PKU

  • 关键词

    情感语音合成  韵律模型  数据稀疏  数据融合  过拟合 

参考文献
  • [1] 赵力,钱向民,邹采荣,吴镇扬. 语音信号中的情感识别研究. 软件学报, 2001,7
  • [2] 王志明,陶建华. 文本-视觉语音合成综述. 计算机研究与发展, 2006,1
  • [3] 蒋丹宁,蔡莲红. 基于语音声学特征的情感信息识别. 清华大学学报(自然科学版), 2006,1
  • [4] 赵力,钱向民,邹采荣,吴镇扬. 语音信号中的情感特征分析和识别的研究. 通信学报, 2000,10
  • [5] Akemi Iida;Nick Campbell;Fumito Higuchi;Michiaki Yasumura. A corpus-based speech synthesis system with emotion. Speech Communication: An International Journal, 2003,1/2
  • [6] J E Cahn. Generating expression in synthesized speech. Cambridge,USA:Massachusetts Institute of Technology, 1989
  • [7] I R Murray;J L Arnott. Implementation and testing of a system for producing emotion-by-rule in synthetic speech. Speech Communicaiton, 1995,04
  • [8] I Iriondo;R Guaus;A Rodriguez. Validation of an acoustical modelling of emotional expression in Spanish using speech synthesis techniques. Newcastle,Northern Ireland, 2000
  • [9] J M Montero;J Gutierrez-Arriola;J Colas. Development of emotional speech synthesiser in Spanish. Budapest,Hungary, 1999
  • [10] J H Tao. Emotion control of Chinese speech synthesis in natural environment. Geneva,Switzerland, 2003
  • [11] R Hecht-Nielsen. Theory of the backpropagation neural network. Washington,DC, 1989
  • [12] M Schroder. Emotional speech synthesis:A review. Aalborg, 2001
  • [13] A J Li;H Wang. Friendly speech analysis and perception in standard Chinese. Korea:Sunjin Printing Co, 2004
  • [14] R Cowie;R R Cornelius. Describing the emotional states that are expressed in speech. Speech Communication, 2003,01
  • [15] M Schroder;R Cowie. Acoustic correlates of emotion dimensions in view of speech synthesis. Eurospeech,Aalborg,Denmark, 2001
  • [16] A Iida;N Campbell. A speech synthesis system with emotion for assisting communication. Newcastle,Northern Ireland, 2000
查看更多︾
相似文献 查看更多>>
3.85.245.126