检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《福建茶叶》2018年第12期303-303,305,共2页Tea in Fujian
基 金:<基于人工智能语音交互(处理)系统研究与应用>(5268001600SV)
摘 要:围绕基于深度神经网络的说话人无关单通道录音分离模型,首先根据说话人的i-vector模型距离将说话人聚类,并证明不同类之间具有明显的可分性。然后基于聚类结果,本文训练了基于DNN的说话人组合检测器,通过该检测器网络的输出信号的能量特征不同,可以判断当前混合录音的说话人组合类别。选择相应的DNN录音分离器将混合录音进行分离。最后通过本文的分离系统与经典的CASA分离系统在PESQ和STOI指标上的实验对比,证明了本文的基于DNN的说话人无关单通道录音分离系统有着明显优势。
关 键 词:单通道 录音分离 说话人无关 DNN i-vector模型
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15