基于音素后验概率和层次凝聚聚类算法的音素边界检测  

Phoneme boundary detection based on phoneme posterior probabilities and hierarchical agglomerative clustering algorithm

在线阅读下载全文

作  者:冯志远[1] 张连海[1] 

机构地区:[1]信息工程大学信息系统工程学院,河南郑州450002

出  处:《太赫兹科学与电子信息学报》2014年第2期260-265,共6页Journal of Terahertz Science and Electronic Information Technology

基  金:国家自然科学基金资助项目(61175017)

摘  要:提出了一种基于音素后验概率和层次凝聚聚类算法的音素边界检测方法。该方法首先利用改进的TRAP结构提取语音信号的帧级音素后验概率;然后,运用层次凝聚聚类算法将提取的音素后验概率进行聚类分析;最后根据其全部的最小损失函数值获取阈值,并通过此阈值决定聚类数目和音素边界。实验证明:该方法具有较好的检测性能,且相对于梅尔倒谱参数(MFCC),音素后验概率更为适合音素边界的检测。A method of phoneme boundary detection based on phoneme posterior probability and Hierarchical Agglomerative Clustering(HAC) is presented. According to this method, phoneme posterior probabilities should first of all be got by Temporal Pattern(TRAP), and then HAC algorithm is chosen to cluster the phoneme posterior probability. Finally, a reasonable threshold can be obtained by all loss function values, and the number of clusters and the phoneme boundaries can be determined by the threshold. The experimental results show that this method is efficient and bears a good detection performance; and the phoneme posterior probabilities are more suitable for phoneme boundary detection than the Mel-Scale Frequency Cepstral Coefficients(MFCC).

关 键 词:音素边界检测 音素后验概率 层次凝聚聚类 

分 类 号:TN912.3[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象