检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《清华大学学报(自然科学版)》2008年第4期574-577,共4页Journal of Tsinghua University(Science and Technology)
基 金:国家自然科学基金资助项目(60572083);信息产业部信息安全计划项目
摘 要:为了提高电话多人语音中提取的单人语音纯度,即多说话人分割聚类处理的性能,该文在传统的分步分割聚类算法机制上增加了重分割处理,提出逐级算法增强处理机制:在分割部分,该文提出了一种基于Bayesian信息准则的分割算法,融合基于不同距离测度检测得出的分割点提高了分割点检测率;在聚类部分提出了基于BIC和交叉似然比准则(CLR)的分层聚类算法;在重分割部分引入和改进了进化隐Markov模型算法精化分割结果。该文在美国国家标准技术局(NIST)1998年度多说话人识别数据库上进行实验,聚类后性能"类纯度"比传统算法提高了10%。Multi-speaker segmentation and clustering of telephone speech was used to improve the quality of extracted single speaker speech. A segmentation-clustering-resegmentation scheme was developed to improve the performance of each step. The segmentation algorithms compares different distance metrics with a refinery scheme based on the Bayesian information criteria algorithm to fuse the segmentation-point results. The clustering uses a hierarchical clustering algorithm which combines BIC and cross likelihood ratio (CLR) metrics the resegmentation step uses an evolutionary hidden Markov model to refine the segmentation result. Tests on the national institute of standards and technology (NIST) 1998 multi-speaker corpus give an overall enhancement as indicated by the cluster purity system performance indicator of 10%.
关 键 词:语音信号处理 电话语音 分割聚类 交叉似然比 进化隐Markov模型
分 类 号:TN912.3[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145