检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李艳妮 张二华[1] LI Yanni;ZHANG Erhua(School of Computer Science and Engineering,Nanjing University of Science and Technology,Nanjing 210094)
机构地区:[1]南京理工大学计算机科学与工程学院,南京210094
出 处:《计算机与数字工程》2020年第7期1558-1563,1622,共7页Computer & Digital Engineering
基 金:军委装备发展部十三五装备预研领域基金项目(编号:61403120102)资助。
摘 要:利用说话人信息自动管理海量混合语音是一个重要的研究课题,为了提高多人会话场景下短语音的说话人分割正确率,论文研究了一种基于高斯混合模型和多尺度分析的说话人分割算法。在提高短语音说话人识别率的基础上,该算法综合使用端点检测和多尺度分析来实现说话人分割,并引入分帧概率来优化说话人分割效果。实际汉语分割实验结果表明,对由一系列短语音(小于3s)交替组成的多人混合语音,该算法取得了较好的分割效果。It is an important research topic to automatically manage massive mixed speech by speaker information.This paper proposes a speaker segmentation algorithm based on Gaussian mixture model and multi-scale analysis in order to improve the accu⁃racy of speaker segmentation of short utterance in multi-person conversation.This algorithm is used to endpoint detection with multi-scale analysis to achieve speaker segmentation,on the basis of improving the speaker recognition rate of short utterance,frame-division probability is applied to optimize the effect of speaker segmentation.The experimental results of Chinese segmenta⁃tion show that the algorithm achieves good segmentation results for mixed voice of multiple speakers composed of a series of short ut⁃terance(less than 3s).
关 键 词:短语音 说话人分割 高斯混合模型 多尺度分析 说话人识别
分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249