电话语音双人检测算法  

Detection algorithm for two-person conversations

在线阅读下载全文

作  者:李科[1] 刘加[1] 

机构地区:[1]清华大学电子工程系,北京100084

出  处:《清华大学学报(自然科学版)》2007年第1期65-68,共4页Journal of Tsinghua University(Science and Technology)

基  金:国家自然科学基金资助项目(60572083);信息产业部信息安全计划项目(2005C41)

摘  要:为了提高两个说话人情况下电话语音双人检测的性能,提出了一种基于长时距离与短时距离之和的双人语音分段算法,并对分段过程中的聚类过程进行了改进。对于分段得到的语音采用基于GMM-UBM(Gaussian mixturemodel-universal background model,GMM-UBM)模型的说话人确认算法,构成一个电话语音双人检测系统。实验结果表明:在美国国家标准技术局1999年组织的年度说话人识别评测双人检测数据库上的检测等错误率为15.1%。该算法取得了良好的效果。An algorithm is given to detect and track speakers in two-person telephone conversations. The approach uses a Gaussian mixture model with a universal background model (GMM-UBM) of speaker detection system as the core speaker recognition engine. The segmentation algorithm is based on the sum of the long-term distance and short-term distance measures, with an improved clustering process. Experiments on the NIST'99 evaluation database show that the detection system based on the segmentation algorithm provides good performance with an EER of 15.1%.

关 键 词:语音信号处理 说话人识别 聚类 通用似然比距离 

分 类 号:TN912.3[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象