电话语音的多说话人分割聚类研究  被引量:6

Multi-speaker segmentation and clustering of telephone speech

在线阅读下载全文

作  者:张薇[1] 刘加[1] 

机构地区:[1]清华大学电子工程系,北京100084

出  处:《清华大学学报(自然科学版)》2008年第4期574-577,共4页Journal of Tsinghua University(Science and Technology)

基  金:国家自然科学基金资助项目(60572083);信息产业部信息安全计划项目

摘  要:为了提高电话多人语音中提取的单人语音纯度,即多说话人分割聚类处理的性能,该文在传统的分步分割聚类算法机制上增加了重分割处理,提出逐级算法增强处理机制:在分割部分,该文提出了一种基于Bayesian信息准则的分割算法,融合基于不同距离测度检测得出的分割点提高了分割点检测率;在聚类部分提出了基于BIC和交叉似然比准则(CLR)的分层聚类算法;在重分割部分引入和改进了进化隐Markov模型算法精化分割结果。该文在美国国家标准技术局(NIST)1998年度多说话人识别数据库上进行实验,聚类后性能"类纯度"比传统算法提高了10%。Multi-speaker segmentation and clustering of telephone speech was used to improve the quality of extracted single speaker speech. A segmentation-clustering-resegmentation scheme was developed to improve the performance of each step. The segmentation algorithms compares different distance metrics with a refinery scheme based on the Bayesian information criteria algorithm to fuse the segmentation-point results. The clustering uses a hierarchical clustering algorithm which combines BIC and cross likelihood ratio (CLR) metrics the resegmentation step uses an evolutionary hidden Markov model to refine the segmentation result. Tests on the national institute of standards and technology (NIST) 1998 multi-speaker corpus give an overall enhancement as indicated by the cluster purity system performance indicator of 10%.

关 键 词:语音信号处理 电话语音 分割聚类 交叉似然比 进化隐Markov模型 

分 类 号:TN912.3[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象