检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]东莞理工学院计算机学院,东莞523808 [2]仲恺农业工程学院计算机科学与工程学院,广州510225
出 处:《科学技术与工程》2013年第12期3297-3300,共4页Science Technology and Engineering
基 金:国家自然科学基金(61101160)资助
摘 要:提出了基于远近距离的说话人聚类算法:首先,使用端点检测算法把语音分割成读音段,然后,采用T2公式对近距离的说话人语音段进行聚类得到语音块,最后,使用谱聚类的方法估计说话人数目,对远距离的说话人(语音块)进行聚类。实验结果表明,在近距离的说话人聚类中,使用T2公式比使用BIC和KL在语音块准确率方面分别高出2.62%和13.84%,在远距离的说话人聚类中,使用谱聚类算法基本上可以把语音中的说话人数目计算出来,当说话人数目为15时,类纯度和说话人纯度可以达到78%,说明该算法可以有效地对说话人进行聚类。A method of speaker clustering based on far and near distance is proposed. Voice activity detector is used to segment speech into speech segments firstly, T2 is used to cluster the near distance speech segments which belongs to the same speaker, so speech chunk can be gotten, and spectral clustering method is used to estimate the number of speaker and cluster speech chunk. Experimental results shows that using T2 can improve 2.62% and 13.84% in speech chunk precise compared with BIC and KL in near distance clustering, respectively, using spec- tral clustering can calculate the number of speaker, clustering purity and speaker purity can reach 78% when the speaker number is fifteen in far distance clustering, which can mean this algorithm can cluster for the speakers ef- fectively.
分 类 号:TN912.3[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.188.181.58