采用深度神经网络的说话人特征提取方法被引量：8

Novel Method for Speaker Feature Extraction Using Deep Neural Network

机构地区：[1]中国科学技术大学语音及语言信息处理国家工程实验室,合肥230027 [2]百度在线网络技术有限公司,北京100085

出　　处：《小型微型计算机系统》2017年第1期142-146,共5页Journal of Chinese Computer Systems

基　　金：国家自然科学基金项目(61273264)资助

摘　　要：在说话人确认中,通常采用的声学特征(如MFCC,PLP特征等)包含的主要是文本信息和信道信息,说话人信息属于其中的弱信息,极易受到语音信号中的文本信息及信道、噪声等干扰的影响.针对这个问题,提出一种基于深度神经网络提取语音信号中说话人特征的方法,该方法用语音识别深度神经网络各个隐层非线性输出值来提取说话人特征.在RSR2015数据库上开展了GMM-UBM文本无关和文本相关说话人确认实验,实验结果表明本文方法提取的特征相对于传统的MFCC特征,系统等错误率(Equal Error Rate,EER)有了明显的下降.In speaker verification, Acoustic features （ e. g. MFCC, PLP, etc. ） that are frequently used contain speech content and chan- nel information mainly, speaker information is a kind of weak information contained in speech signal, which may be affected easily by other information and disturbance contained in speech signal such as speech content, channel variation, and noise. To address this prob- lem,this paper proposes a new way of speaker feature extraction based on deep neural network for ASR, which uses nonlinear output of hidden layers in DNN. Text-independent and text-dependent GMM-UBM experiments on RSR2015 database showed that the pro- posed method can achieve a valid performance gain over the MFCC feature on EER.

关键词：说话人确认深度神经网络 DN特征

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

采用深度神经网络的说话人特征提取方法被引量：8

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

采用深度神经网络的说话人特征提取方法 被引量：8

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

采用深度神经网络的说话人特征提取方法被引量：8