检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院自动化研究所模式识别国家重点实验室,北京100190
出 处:《声学学报》2013年第5期632-637,共6页Acta Acustica
基 金:国家自然科学基金(91120303;61273267;90820011)资助
摘 要:虽然浮值掩蔽比二值掩蔽有更好的语音分离效果,但是由于理想浮值掩蔽难以直接估计,现有的语音分离系统通常以理想二值掩蔽估计作为计算目标。我们提出了一个二值掩蔽到浮值掩蔽的泛化算法。由于实现浮值掩蔽估计的关键在于噪声能量追踪,我们首先采用指数分布刻画以混合谱和噪声能量以混合能量及二值掩蔽为观测的条件分布。其次,采用高斯马尔柯夫条件随机场刻画噪声估计在连续几帧内的关联。最后,采用马尔柯夫链-蒙特卡洛计算噪声能量最小均方误差估计并进一步计算浮值掩蔽。实验表明,相比于基于二值掩蔽估计的常规算法,我们所提出的算法在信噪比增益和客观感知质量两方面都有显著提高。Although ratio mask may achieve better speech separation results than that by binary mask, present speech separation systems usually set Ideal Binary Mask (IBM) as the computational goal due to the fact that it's very difficult to estimate Ideal Ratio Mask (IRM) directly. In this paper, a generalization algorithm from the binary mask to ratio mask is proposed. Since the key issue in IRM estimation is the noise tracking, we firstly use exponential distribution to model the noise power with binary mask and mixture power as conditions. Then, we use a Gaussian Markov Random Field (GMRF) to model the correlation of noise estimation between adjacent units. Finally, we apply Markov Chain Monte Carlo method to compute the minimum mean square error estimation of noise power and ratio mask. Systematic experiments show that the proposed algorithm outperforms a common binary masking based method in terms of SNR gain and PESQ scores.
关 键 词:噪声估计 掩蔽 二值 算法 追踪 最小均方误差估计 直接估计 时频
分 类 号:TN912.3[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3