检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]信息工程大学信息系统工程学院,河南郑州450002
出 处:《太赫兹科学与电子信息学报》2014年第2期260-265,共6页Journal of Terahertz Science and Electronic Information Technology
基 金:国家自然科学基金资助项目(61175017)
摘 要:提出了一种基于音素后验概率和层次凝聚聚类算法的音素边界检测方法。该方法首先利用改进的TRAP结构提取语音信号的帧级音素后验概率;然后,运用层次凝聚聚类算法将提取的音素后验概率进行聚类分析;最后根据其全部的最小损失函数值获取阈值,并通过此阈值决定聚类数目和音素边界。实验证明:该方法具有较好的检测性能,且相对于梅尔倒谱参数(MFCC),音素后验概率更为适合音素边界的检测。A method of phoneme boundary detection based on phoneme posterior probability and Hierarchical Agglomerative Clustering(HAC) is presented. According to this method, phoneme posterior probabilities should first of all be got by Temporal Pattern(TRAP), and then HAC algorithm is chosen to cluster the phoneme posterior probability. Finally, a reasonable threshold can be obtained by all loss function values, and the number of clusters and the phoneme boundaries can be determined by the threshold. The experimental results show that this method is efficient and bears a good detection performance; and the phoneme posterior probabilities are more suitable for phoneme boundary detection than the Mel-Scale Frequency Cepstral Coefficients(MFCC).
分 类 号:TN912.3[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.75