说话人聚类

作品数:23被引量:44H指数:5
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:王炳锡李艳雄屈丹侯风雷何磊更多>>
相关机构:解放军信息工程大学华南理工大学清华大学中国科学院更多>>
相关期刊:《声学技术》《光学精密工程》《数据采集与处理》《计算机应用与软件》更多>>
相关基金:国家自然科学基金中央高校基本科研业务费专项资金国家高技术研究发展计划国家级大学生创新创业训练计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
多模型融合的VoxSRC22说话人日志系统
《计算机工程与应用》2024年第10期164-172,共9页杜雨轩 周若华 
为有效解决“谁在什么时候说话”的问题,提出一种说话人日志方法。该方法由六个模块组成,包括语音活动检测(voice activity detection,VAD)、语音增强、说话人嵌入提取器、说话人聚类、重叠语音检测(overlapping speech detection,OSD)...
关键词:说话人日志 语音活动检测 声纹嵌入 说话人聚类 结果融合 
基于特征融合的说话人聚类算法被引量:6
《东北大学学报(自然科学版)》2021年第7期952-959,共8页郑艳 姜源祥 
国家自然科学基金资助项目(61773108).
针对单一声学特征和k-means算法在说话人聚类技术中的局限性,为了更好地表达说话人的个性信息并提高说话人聚类的准确率,将特征融合和AE-SOM神经网络应用于说话人聚类中,提出一种改进的说话人聚类算法.该算法通过对语音信号特征分析,将M...
关键词:声学特征 K-MEANS 说话人聚类 特征融合 AE-SOM 神经网络 
用说话人相似度i-vector的非负值矩阵分解说话人聚类被引量:1
《计算机应用与软件》2017年第4期165-168,242,共5页哈尔肯别克.木哈西 钟珞 达瓦.伊德木草 
国家自然科学基金项目(61163030)
基于贝叶斯或者全贝叶斯准则的说话人自动聚类或者识别方法,主要采取重复换算全发话语音段的相似量度,再组合相似性较大的语音片段实现说话人的聚类。这种方法中如果发话语音片段数越多,组合计算时间就越长,系统实时性变差,而且各说话...
关键词:说话人分割及聚类 非负值矩阵分解 i-vector GMM 电话语音 
说话人聚类的初始类生成方法
《计算机工程与应用》2017年第3期149-153,共5页赖松轩 李艳雄 
国家自然科学基金(No.61101160);广州市珠江科技新星专项(No.2013J2200070);华南理工大学大学生课外创新训练项目;中央高校基本科研业务费本科生自主选题项目(No.10561201501)
目前说话人聚类时将说话人分割后的语音段作为初始类,直接对这些数量庞大语音段进行聚类的计算量非常大。为了降低说话人聚类时的计算量,提出一种面向说话人聚类的初始类生成方法。提取说话人分割后语音段的特征参数及特征参数的质心,...
关键词:层次聚类 贝叶斯信息准则 说话人聚类 初始类 语音信号处理 
基于变分贝叶斯改进的说话人聚类算法被引量:2
《数据采集与处理》2017年第1期54-61,共8页李敬阳 李锐 王莉 王晓笛 
公安部应用创新计划(2014YYCXGAES048)资助项目
说话人聚类是说话人分离中的一个重要过程,然而传统的以贝叶斯信息准则作为距离测度的层次聚类方式,会出现聚类误差向上传递的情况。本文提出了一种逐级算法增强处理机制。当片段之间的最小贝叶斯信息准则距离超过设定的门限值时,或者...
关键词:说话人聚类 贝叶斯信息准则 概率线性判别分析 变分贝叶斯 
基于跨模态的无监督影视剧说话人识别
《计算机应用与软件》2016年第5期132-135,147,共5页冯骋 库天锡 杨卫星 李雪蒙 谭小琼 梁超 
国家自然科学基金重点项目(61231015)
现如今,影视剧的海量增长给其有效管理带来了巨大挑战,而其中的角色识别在影视剧内容管理中具有重大意义。传统的角色识别主要采用依赖于训练样本质量的有监督学习,而现实中一般难以获得充足的训练样本。针对影视剧中的角色识别,提出一...
关键词:说话人识别 说话人聚类 编辑距离 混合高斯模型 序列匹配 
结合两种距离测度的说话人聚类算法被引量:1
《小型微型计算机系统》2015年第10期2369-2373,共5页陈玥同 刘学亮 
国家"八六三"高技术研究发展计划项目(2014AA015104)资助
说话人聚类研究如何将一段语音中同一说话人的语音聚合.提出一种基于结合广义似然比与归一化交叉似然比两种距离测度的聚类算法.算法首先提取每一段语音信号的MFCC特征,并建立高斯混合模型,最后采用基于结合广义似然比与归一化交叉似然...
关键词:说话人聚类 广义似然比 归一化交叉似然比 贝叶斯判据 
基于语速差异的新闻发布会中首要说话人检测
《计算机工程与应用》2015年第4期222-225,231,共5页吴伟 李艳雄 王梓里 陈祝允 
国家自然科学基金项目(No.61101160);广州市珠江科技新星专项(No.2013J2200070);中央高校基本科研业务费专项资金重点项目(No.2013ZZ053);国家级大学生创新训练项目(No.201210561046);广东省大学生创新训练项目(No.1056112028)
新闻发布会中,首要说话人(例如政府要员)通常要即兴回答记者事先准备好的问题。因而首要说话人语速一般很慢,而其他说话人(例如记者、翻译等)语速则相对较快。基于两者的语速差异,采用一个滑动窗从连续语音流中截取语音段,再估计各音段...
关键词:新闻发布会语音 语速差异 首要说话人 说话人分割 说话人聚类 
基于矢量量化的时序说话人聚类方法被引量:5
《科学技术与工程》2014年第2期41-44,共4页陈祝允 李艳雄 杜佳媛 
国家自然科学基金项目(61101160);广州市珠江科技新星专项(2013J2200070);中央高校基本科研业务费专项资金重点项目(2013zz0053);国家级大学生创新训练项目(201210561046);广东省大学生创新训练项目(1056112028)资助
针对传统分层聚类方法运算速度较慢的问题,提出一种基于矢量量化的时序说话人聚类方法。首先对各语音段的特征进行矢量量化得到各语音段的码本,然后采用贝叶斯信息判据计算各码本之间的距离,最后按时间先后顺序进行说话人聚类。采用会...
关键词:时序说话人聚类 矢量量化 贝叶斯信息判据 梅尔频率倒谱系数 
基于远近距离的说话人聚类算法
《科学技术与工程》2013年第12期3297-3300,共4页陈雪芳 杨继臣 
国家自然科学基金(61101160)资助
提出了基于远近距离的说话人聚类算法:首先,使用端点检测算法把语音分割成读音段,然后,采用T2公式对近距离的说话人语音段进行聚类得到语音块,最后,使用谱聚类的方法估计说话人数目,对远距离的说话人(语音块)进行聚类。实验结果表明,在...
关键词:说话人聚类 近距离聚类 远距离聚类 
检索报告 对象比较 聚类工具 使用帮助 返回顶部