检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:石倩 陈航艇 张鹏远[2,3] SHI Qian;CHEN Hangting;ZHANG Pengyuan(Institute of Acoustics,School of Physics,Nanjing University,Nanjing 210093;Key Laboratory of Speech Acoustics and Content Understanding,Institute of Acoustics,Chinese Academy of Sciences,Beijing 100190;University of Chinese Academy of Sciences,Beijing 100049)
机构地区:[1]南京大学声学研究所,南京210093 [2]中国科学院声学研究所语言声学与内容理解重点实验室,北京100190 [3]中国科学院大学,北京100049
出 处:《声学学报》2022年第1期139-150,共12页Acta Acustica
基 金:中国科学院战略性先导科技专项项目(XDC08010300);国家自然科学基金项目(11774380,62071461)资助。
摘 要:提出了波达方向初始化空间混合概率模型的语音增强算法。通过声源定位估计出声源波达方向,再根据此计算相对传递函数,进而构造空间协方差矩阵来初始化空间混合概率模型。论证了相对传递函数在作为模型参数中语音协方差矩阵的主特征向量时,空间混合概率模型对应的概率分布可达到最大值,进而使期望最大化算法在迭代时更易收敛,以得到期望的掩蔽值。实验先后在自建仿真数据集和CHiME-4的两通道数据集中进行验证,结果表明,将波达方向信息引入到语音增强后语音识别系统的词错误率可以比未引入波达方向的词错误率最多降低3.79%,信号失真比最多提升2.00 dB,验证了在结合波达方向后的空间混合概率模型进行语音增强时性能有所提升。A speech enhancement method using the Direction of Arrival(DOA) to initialize Expectation-Maximization(EM) algorithm is proposed,which can improve the mask estimation performance based on the spatial mixture probabilistic model.DOA is estimated to construct the relative transfer function,and then initializes the spatial covariance matrix It is demonstrated that the probability distribution of the spatial mixture probability model will reach the maximum value when the relative transfer function serves as the main eigenvector of the speech covariance matrix,which makes the EM algorithm easier to converge to obtain the desired mask value.The experiment is verified with the Word Error Rate(WER) on a simulated two-channel dataset and the two-channel part of the CHiME4 dataset.The result shows that directional information improves the speech enhancement performance,reduces the WER by 3.79%,and improves the SDR by 2.00 dB the most.
关 键 词:期望最大化算法 混合概率模型 通道数据 波达方向 初始化 语音增强 协方差矩阵 语音识别系统
分 类 号:TN912.35[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.31