基于迁移学习和基频特征融合的文本相关说话人识别框架  被引量:1

The text-dependent speaker verification framework based on transfer learning and feature fusion

在线阅读下载全文

作  者:马皓天 洪峰[1] 毛海全 徐楚林[1] 胡梦璐 牟宏宇[1] 陈友元[1] 许伟杰[1] MA Haotian;HONG Feng;MAO Haiquan;XU Chulin;HU Menglu;MOU Hongyu;CHEN Youyuan;XU Weijie(Shanghai Acoustics Laboratory,Chinese Academy of Sciences,Shanghai 201815,China;University of Chinese Academy of Sciences,Beijing 100190,China)

机构地区:[1]中国科学院声学研究所东海研究站,上海201815 [2]中国科学院大学,北京100190

出  处:《声学技术》2024年第5期677-685,共9页Technical Acoustics

基  金:中国科学院声学研究所自主部署"前沿探索"项目(QYTS202114);中国科学院青年创新促进会(2021022)项目;上海市自然科学基金项目(22ZR1475700)。

摘  要:目前,面向我国金融支付的说话人识别技术在社会层面上没有大范围的推广,其原因在于数据集的缺乏以及识别技术未能满足安全性要求。针对上述问题,文章录制了用于中文数字串文本相关说话人识别的SHALCAS-WXSD22B数据集,用于金融支付场景中的数字串声纹识别研究,并提出一种基于迁移学习和基频特征融合的文本相关说话人识别框架,提高了文本相关说话人识别技术的可靠性。在数字串SHALCAS-WXSD22B-d006和SHALCAS-WXSD22B-d007语料实验中,所提框架实现的最佳等错误率分别为0.88%和1.05%,与ECAPA-TDNN基线模型相比等错误率相对降低了17和20个百分点,且达到了支付场景下的声纹识别安全性指标。实验结果表明,文中所提框架不仅具有更好的识别准确率和安全性能,而且同样能提高框架中包括ResNet34在内的其他log-Mel识别模型的性能。The speaker verification technique for financial payments in China is not widely promoted at the societal level due to lack of datasets and the security of the models.In this paper,a text-related speaker verification framework based on transfer learning and fundamental frequency feature fusion is proposed to address the above problems on the self-recorded SHALCAS-WXSD22B dataset.In the digital string SHALCAS-WXSD22B-d006 and SHALCAS-WXSD22B-d007 corpus experiments,the best equal error rates achieved by the proposed framework implementation are 0.88%and 1.05%.Compared with the ECAPA-TDNN baseline model,this method can reduce the equal error rates by 17%and 20%respectively and achieves security indicators in the field of financial payments.The experimental results show that the proposed method not only has better recognition accuracy and higher security performance compared to baseline methods,but also can be applied to other log-Mel models including ResNet34.

关 键 词:文本相关说话人识别 迁移学习 基频特征 嵌入级融合 决策级融合 

分 类 号:H107[语言文字—汉语]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象