检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001
出 处:《清华大学学报(自然科学版)》2009年第S1期1363-1368,共6页Journal of Tsinghua University(Science and Technology)
基 金:高等学校博士学科点专项科研基金(20050213032);国家自然科学基金资助项目(60772076);国家"八六三"高技术项目(2006AA01Z197)
摘 要:语音情感识别领域提取情感特征时,普遍采用"不同情感类别,相同时长基准"的做法,忽略了人耳敏感的韵律段长会依情感不同而有所差异的现象。本文首先通过情感识别实验确定各类情感的最佳识别段长,作为人耳敏感韵律段长。并构造了基于韵律段特征的多重Elman网络模型,以期对不同情感基于特定敏感韵律段长进行识别和对多分类器识别结果进行有效融合,实现了对人耳情感辨识规律的模拟。结果表明,使用敏感韵律段特征的系统识别率达到67.9%,与使用定长语段特征相比有了很大的提高。In the field of speech emotion recognition,the emotion features of different emotional utterances are commonly extracted at the same segment length level.This ignores the variation of the human ear's sensitive prosodic segment length for different emotions.In the present system the best segment length for emotion recognition of each emotion was first obtained through experiments.A multi-network model named the prosodic segment level Elman network was then proposed to identify emotions using certain sensitive prosodic segment level features and then to combine the recognition results of each sub-network.Tests show that the recognition rate of sensitive prosodic segment level features is 67.9%,much higher than the rate obtained by fixed-length segment level features.
关 键 词:情感特征 敏感韵律段长 语段特征 ELMAN神经网络 语音情感识别
分 类 号:TP391.42[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.52