基于DNN的说话人无关单通道录音分离  

在线阅读下载全文

作  者:徐海青 吴立刚 浦正国 韩涛 

机构地区:[1]安徽继远软件有限公司,安徽合肥230000

出  处:《福建茶叶》2018年第12期303-303,305,共2页Tea in Fujian

基  金:<基于人工智能语音交互(处理)系统研究与应用>(5268001600SV)

摘  要:围绕基于深度神经网络的说话人无关单通道录音分离模型,首先根据说话人的i-vector模型距离将说话人聚类,并证明不同类之间具有明显的可分性。然后基于聚类结果,本文训练了基于DNN的说话人组合检测器,通过该检测器网络的输出信号的能量特征不同,可以判断当前混合录音的说话人组合类别。选择相应的DNN录音分离器将混合录音进行分离。最后通过本文的分离系统与经典的CASA分离系统在PESQ和STOI指标上的实验对比,证明了本文的基于DNN的说话人无关单通道录音分离系统有着明显优势。

关 键 词:单通道 录音分离 说话人无关 DNN i-vector模型 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象