基于均值特征和改进深度神经网络的说话人识别算法被引量：2

Speaker recognition based on mean feature and improved deep neural network

作　　者：罗春梅张风雷 LUO Chunmei;ZHANG Fenglei(School of Chemical and Mechanical Engineering,Eastern Liaoning University,Dandong 118000,Liaoning,China)

机构地区：[1]辽东学院化工与机械学院,辽宁丹东118000

出　　处：《声学技术》2021年第4期503-507,共5页Technical Acoustics

基　　金：辽宁省教育厅科学研究项目(LNSJYT201904)。

摘　　要：为提高神经网络在说话人识别应用中的识别性能,提出基于高斯增值矩阵特征和改进深度卷积神经网络的说话人识别算法。算法首先通过最大后验概率提取基于梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征的高斯均值矩阵,并对特征进行噪声适应性补偿,以增强信号的帧间关联和说话人特征信息,然后采用改进的深度卷积神经网络进一步对准帧间信息,以提高说话人识别特征对背景噪声的适应性。实验结果表明,相比于高斯混合模型-通用背景模型等识别框架及传统MFCC等特征,该算法可取得更高的识别准确率和最小的识别均方误差。In order to improve the recognition performance,a speaker recognition algorithm based on Gaussian valueadded matrix features and improved deep convolutional neural network is proposed.In the algorithm,the adaptive Gaussian mean matrix based on Mel frequency cepstrum coefficient(MFCC)features is first extracted by the maximum posterior probability,and the noise adaptive compensation for features is performed to enhance interframe correlation and speaker feature information.Then,an improved deep convolutional neural network is used to further align the interframe information to improve the feature learning for speaker recognition and the adaptability to the back-ground noise environment.The experimental results show that,compared with Gaussian mixture model-general background model(GMM-UBM)framework and traditional MFCC features,the algorithm proposed in this paper achieves the best recognition accuracy and the least recognition mean square error.

关键词：说话人识别梅尔频率倒谱系数(MFCC) 深度卷积神经网络高斯均值矩阵

分类号：TN912.34[电子电信—通信与信息系统]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于均值特征和改进深度神经网络的说话人识别算法被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于均值特征和改进深度神经网络的说话人识别算法 被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于均值特征和改进深度神经网络的说话人识别算法被引量：2