基于语音PZCPA时频域特征融合的语音情感识别方法  被引量:1

Speech emotion recognition method based on speech PZCPA time-frequency domain feature fusion

在线阅读下载全文

作  者:阿卜杜萨拉木•艾海提 陈恳[1] Abudusalamu Aihaiti;Chen Ken

机构地区:[1]宁波大学信息科学与工程学院,浙江宁波315211

出  处:《数据通信》2021年第2期42-46,51,共6页

基  金:国家自然科学基金资助项目(No.60972063);宁波市自然科学基金资助项目(No.2014A610065);宁波大学科研基金(理)/学科资助项目(No.XKXL308)。

摘  要:从人类自然语言中提取和准确分类语音中的情感状态一直是人机交互的一个难点,同时相关研究在人工智能领域发挥着至关重要的作用。为了使语音情感识别系统有更好的鲁棒性,本文提出新的语音情感识别算法结构,主要包括PZCPA特征的提取方法,并且使用该特征进行基于深度学习的时域和频域特征融合,最后使用KNN进行语音情感识别。该算法在德国柏林语音情感数据库中加以验证,并且使用混淆矩阵做出了评价。通过实验得出,算法的整体识别率到达了88.33%,其中对生气的识别率达到了95%,此外,其中能量较低、特征较为一般的恐惧、悲伤、中性这三种情感的识别率达到了83.33%、86.67%、86.64%,平均识别率比传统的方法提高了13.3%。最终结果表明,本文提出算法语音情感识别性能优越于同类算法。

关 键 词:特征提取 特征融合 深度学习 情感识别 

分 类 号:TN912.34[电子电信—通信与信息系统] TP18[电子电信—信息与通信工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象