基于后验概率特征的改进无监督语音样例检测  

Improved Posteriorgram-Based Detection of Unsupervised Query-by-Example Spoken Terms

在线阅读下载全文

作  者:李勃昊[1] 张连海[1] 董桂芬[2] 郑永军[1] 

机构地区:[1]信息工程大学,河南郑州450001 [2]海军指挥学院,江苏南京210016

出  处:《信息工程大学学报》2015年第4期449-453,共5页Journal of Information Engineering University

基  金:国家自然科学基金资助项目(61175017)

摘  要:针对现有无监督语音样例检测精度不高的现状,提出一种基于后验概率特征和主成分分析的方法。该方法首先利用无标注语料训练GMM,得到训练数据频谱参数的高斯混元后验概率特征向量序列;采用层次聚类算法检测其边界信息得到声学分段,利用K-means算法对所有声学分段聚类并添加标签,通过声学分段和标签训练基于后验概率的声学分段模型(ASMs);ASMs将查询项与检索文档的高斯混元后验概率转换为新的后验概率,利用主成分分析方法对其优化处理,保持概率向量维数不变,去除噪声信息,提高后验概率特征向量鲁棒性与区分性;最后通过分段动态时间规整算法检索查询项。实验证明该方法的检索精度较现有方法有显著提升。This paper presents a study of using posterior features and principal components analysis to improve the detection of unsupervised query-by-example spoken terms. A Gaussian Mixture Model is trained without any transcription information to label speech frames with Gaussian posteriorgram. Through hierarchical agglomerative clustering and K-means, the boundaries and labels are obtained to train acoustic segment models (ASMs). Additionally by principal components analysis, ASMs posteriorgrams are extracted and then the segmental dynamic time warping is applied to match the query, to test posteriorgrams, and to locate possible occurrences of the query term. Experimental re- suits show that the proposed method consistently outperform the traditional method.

关 键 词:无监督 语音样例检测 后验概率 声学分段模型 主成分分析 

分 类 号:TP391.42[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象