基于韵律语段的语音情感识别方法研究  被引量:8

Speech emotion recognition based on prosodic segment level features

在线阅读下载全文

作  者:韩文静[1] 李海峰[1] 

机构地区:[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001

出  处:《清华大学学报(自然科学版)》2009年第S1期1363-1368,共6页Journal of Tsinghua University(Science and Technology)

基  金:高等学校博士学科点专项科研基金(20050213032);国家自然科学基金资助项目(60772076);国家"八六三"高技术项目(2006AA01Z197)

摘  要:语音情感识别领域提取情感特征时,普遍采用"不同情感类别,相同时长基准"的做法,忽略了人耳敏感的韵律段长会依情感不同而有所差异的现象。本文首先通过情感识别实验确定各类情感的最佳识别段长,作为人耳敏感韵律段长。并构造了基于韵律段特征的多重Elman网络模型,以期对不同情感基于特定敏感韵律段长进行识别和对多分类器识别结果进行有效融合,实现了对人耳情感辨识规律的模拟。结果表明,使用敏感韵律段特征的系统识别率达到67.9%,与使用定长语段特征相比有了很大的提高。In the field of speech emotion recognition,the emotion features of different emotional utterances are commonly extracted at the same segment length level.This ignores the variation of the human ear's sensitive prosodic segment length for different emotions.In the present system the best segment length for emotion recognition of each emotion was first obtained through experiments.A multi-network model named the prosodic segment level Elman network was then proposed to identify emotions using certain sensitive prosodic segment level features and then to combine the recognition results of each sub-network.Tests show that the recognition rate of sensitive prosodic segment level features is 67.9%,much higher than the rate obtained by fixed-length segment level features.

关 键 词:情感特征 敏感韵律段长 语段特征 ELMAN神经网络 语音情感识别 

分 类 号:TP391.42[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象