基于深度神经网络的说话人年龄分类研究  被引量:1

Speaker age classification based on deep neural network

在线阅读下载全文

作  者:杨治学 黄浩[1,2,3] 胡英 吾守尔·斯拉木 YANG Zhixue;HUANG Hao;HU Ying;WUSHOUR Silamu(School of Information Science and Engineering,Xinjiang University,Urumqi 830046,China;Multi-language Information Technology Laboratory of Xinjiang,Urumqi 830046,China;Multi-language Information Technology Research Center of Xinjiang,Urumqi 830046,China)

机构地区:[1]新疆大学信息科学与工程学院,新疆乌鲁木齐830046 [2]新疆多语种信息术实验室,新疆乌鲁木齐830046 [3]新疆多语种信息技术研究中心,新疆乌鲁木齐830046

出  处:《现代电子技术》2021年第10期120-124,共5页Modern Electronics Technique

基  金:国家重点研发计划(2017YFB1402101);国家自然科学基金资助项目(61663044);国家自然科学基金资助项目(61761041)。

摘  要:说话人年龄分类是通过说话人的语音来估测说话人的年龄范围,属于说话人属性分析的重要内容。传统说话人年龄分类是利用人工提取特征加后端分类器的方法,这种方法不一定能够得到最优的分类效果。针对该问题,利用深度神经网络自动获取特征表示的能力,提出一种基于深度神经网络的年龄分类方法,采用提取文本无关的说话人语音特征来通过深度神经网络对说话人年龄进行分类。在1000 h的AISHELL⁃2中文开源语音数据库上验证了所提出方法的有效性。与基于i⁃vector结合后端分类器的两阶段说话人年龄分类方法做了比较,实验结果证明,与i⁃vector方法相比,识别正确率获得了3.08%的性能提升。The speaker age classification refers to the estimation of his(or her)age range according to the speaker's speech,which is an integral part of the speaker attribute analysis.The traditional method of age classification for speakers is to use manual feature extraction and back⁃end classifier.However,this method may be unable to obtain the optimal classification result.To solve this problem,an age classification method based on deep neural network is proposed by utilizing the ability of the deep neural network to automatically obtain feature representations.The features independent from any texts is extracted with the method to classify the speaker′s age by the deep neural network.The effectiveness of the proposed model was verified on the 1000 hour AISHELL⁃2 Chinese open⁃source speech database.The experiments result show that,in comparison with the two⁃stage speaker age classification method based on I⁃vector and back⁃end classifier,the recognition correctness of the propose model has increased 3.08%.

关 键 词:说话人年龄分类 深度神经网络 语音特征提取 说话人识别 数据分析 比较实验 

分 类 号:TN911.23-34[电子电信—通信与信息系统] TP311[电子电信—信息与通信工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象