当前位置: 首页 > >

希尔伯特边际谱在语音情感识别中的应用

发布时间:

第28卷第2期 2009年4月 声学技术 Technical Acoustics VOI.28.NO.2 Apr.,2009 希尔伯特边际谱在语音情感识别中的应用 谢珊,曾以成,蒋阳波 (湘潭大学光电工程系,湖南湘潭41 1 105) 摘要:利用希尔伯特.黄变换(Hilbert-Huang Transform,HHT)对情感语音进行处理,得到其边际谱,然后对比分析四 种情感即高兴、乍气、厌恶、无情感语爵信号边际谱的特征,提出四个特征最:子带能量(SE)、子带能量的一阶差分 (DSE)、子带能量倒谱系数(SECC)、子带能量倒谱系数的一阶差分(DSECC)用于情感识别。用它们作说话人无关,文 本无关的语音情感识别,得到最高90%的识别率,比基于傅立叶变换的梅尔频率倒潜系数(MFCC)高22个百分点。 实验结果表明,基于HHT边际谱的特征能够较好地反映语音信号中的情感信息。 关键词:情感识别:边际谱;HHT 中图分类号:TN912 文献标识码:A 文章编号:1000.3630(2009)-02-0148.05 DOI编码:10.39690.issnl000—3630.2009.02.012 Application of Hilbert marginal spectrum in speectl emOtlOn recognition XIE Shan.ZENG Yi.cheng.JIANG Yang-bo (Photoelectronics Department,Xiangtan University,Xiangtan,41 1 105,Hunan,China) Abstract:Marginal spectrum four different of the marginal of the emotional speech is obtained through Hilbert-Huang Transform.Speech signals of emotions,namely happy,angry,boring and natrual,are analyzed contrastively focusing on the characteristics spectrum.Then four features:SE,DSE,SECC and DSECC are extracted for emotion recognition.Fi— emotion recognitions are nally speake卜independent and text—independent simulated by using these features respective— 90%,which is 22 percentage higher than Fourier Transform based feature MFCC.Thus.conclusion is drawn that HHT marginal spectrum can well reflect the emotional information in speech. ly,which gains the best Key words:emotion recognition rate of recognition;marginal spectrum;HHT 个方面的特征忡1。陶建华分析了不同情感语音在基 1 引言 语音情感识别具有广阔的应用前景。在人机交 音、时长、能量等方面的差异,并对基音均值等18 个特征根据其各自的识别效果进行了排序H’。 Nicholson等人提取基音频率、功率谱和线性预测系 数(LPC),对9种情感进行识别,但识别率只有51%H。 Vladmir将短时特征和长时特征结合起来,分别对 不同的语种进行情感识别,最高识别率为67%p1。 希尔伯特.黄变换(HHT)是一种适用于非线性、 非*稳信号的处理方法p1。它通过经验模式分解 (Empirical Mode Decomposition,EMD)将信号的内 流方面¨1,能赋予计算机识别情感和表达情感的能 力,使交流更加人性化;在自动电话服务系统中l“, 可使合成的语音更加动听,不再单调;在娱乐方面, 互动电影p1通过情感识别让观众参与电影的创作, 是未来电影发展的方向;智能玩具和电子宠物一1通 过情感识别可与人进行更加人性化的情感交流。此 外,语音情感识别还可以应用于辅助教学、精神诊 断和测谎等方面¨-。 语音情感识别包括三个步骤:样本采集,特征 提取和特征识别p-,其中特征提取最重要,它直接 决定了识别的效果。到目前为止,用于情感识别的 主要有基音频率、共振峰、频谱、能量和时长等几 收稿日期:2008—03-Ol:修回日期:2008.04—13 作者简介:谢珊(1983.),女,湖南岳阳人,硕士研究生,研究方向为语 音情感识别。 通讯作者:曾以成.E-mail:yichengz@xtu.exlu.∞ 部振荡模式逐级分离出来【”1,并通过希尔伯特变换 得到其瞬时频率和幅度。本文运用HHT对语音信 号进行处理,比较分析不同情感语音的边际谱,并 在此基础上提取一组特征用于情感识别,实验结果 证明基于HHT边际谱的特征能够较好地反映语音 的情感信息。 2基于HHT的边际谱 根据HHT的原理,首先对语音信号进行EMD, 万方数据  



友情链接: 时尚网 总结汇报 幼儿教育 小学教育 初中学习资料网