说话人

作品数:1857被引量:4757H指数:35
导出分析报告
相关领域:语言文字更多>>
相关作者:李艳雄李燕萍赵力张燕贺前华更多>>
相关机构:华南理工大学清华大学中国科学院黑龙江大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于多尺度可变形注意力编码与多路径融合的未知说话人语音分离
《信号处理》2025年第4期718-729,共12页王春丽 刘素倩 陈善立 
兰州交通大学及对口支援高校(LH2023002);兰州交通大学青年基金项目(LH2019005);内蒙古重点研发及成果转化项目(2023YFSH0043,2023YFDZ0043);甘肃省重点人才项目。
针对在含有噪声和混响的复杂环境中对未知说话人语音分离任务的研究,提出了一种基于多尺度可变形注意力编码与多路径融合的未知说话人语音分离模型。现有的针对未知说话人的语音分离模型是在纯净的实验环境条件下分析的模型性能,不符合...
关键词:未知说话人语音分离 多尺度可变形注意力编码策略 多路径融合 吸引子估计 
融合叙事单元和可靠标签的小说说话人识别框架
《计算机应用》2025年第4期1190-1198,共9页刘天宇 陶冶 鲁超峰 刘家旺 
国家重点研发计划项目(2023YFF0612100);青岛市关键技术攻关及产业化示范项目(24-1-2-qljh-19-gx)。
小说中的说话人识别(SI)旨在通过引语所在上下文判断它的说话人。这项任务对在制作有声书的过程中为不同的角色分配合适的声音有很大帮助。然而,现有方法对引语上下文的选择主要以固定窗口值为主,这种方式不够灵活,会产生冗余文段,导致...
关键词:说话人识别 自训练 伪标签 预训练 上下文 小说 
基于改进SKA-TDNN的说话人语音聚类研究
《计算机仿真》2025年第3期358-364,共7页陆思宇 姜因 王志翼 
公安学科基础理论研究创新计划项目(2022XKGJ0110);辽宁省科技厅联合开放基金机器人学国家重点实验室开放基金资助项目(2020-KF-12-11);中国政法大学证据科学教育部重点实验室开放基金资助课题(2021KFKT09);中央高校基本科研业务费专项资金资助(3242019010);辽宁省自然科学基金项目(2019-ZD-0168);教育部重点研究项目(E-AQGABQ20202710)。
说话人语音聚类可广泛应用于大规模无标注语音数据的预处理任务中。针对短时语音段的特征提取能力弱以及聚类算法聚类不稳定的问题,基于可变卷积核注意力时延网络(SKA-TDNN)提出一种带有多尺度注意力的网络结构。在不增加网络体积的基础...
关键词:说话人语音聚类 时延神经网络 注意力机制 
基于子频带前端模型和反向特征融合的说话人确认方法
《计算机科学》2025年第3期214-221,共8页王萌威 杨哲 
教育部产学合作协同育人项目(220606363154256)。
现有说话人确认方法中用于提取帧级特征的时延神经网络(TDNN)存在两个问题,一是缺少对局部频率特征的建模能力,二是多层特征融合方式无法对高层和低层特征之间的复杂关系进行有效建模。因此,提出一种新的前端模型以及一种新的多层特征...
关键词:声纹识别 说话人确认 时延神经网络 子频带特征提取 多层特征融合 
说话人运动状态对语音同一认定的影响
《中国人民公安大学学报(自然科学版)》2025年第1期24-32,共9页潘洪兵 刘德臣 高海洋 
2023年吉林警察学院科研项目(jykyyb202312);2023年吉林省公安厅科研项目(JSYJ04-2023);吉林省教育科学规划2024年度一般课题(GH24823);2023年吉林省教育厅科学技术研究规划项目(JJKH20231084KJ)。
为了探究运动状态下说话人的语音特征,提高语音同一认定的准确性,以0 km/h、5 km/h、10 km/h、15 km/h步速下的语音样本为研究对象,从听觉特征和频谱特征两方面总结出了易受和不易受步速影响的语音特征,以期为司法语音检验提供参考。结...
关键词:运动状态 语音特征 语音同一认定 声纹检验 
融合大语言模型和预训练模型的少量语料说话人-情感语音转换方法
《计算机应用》2025年第3期815-822,共8页鲁超峰 陶冶 文连庆 孟菲 秦修功 杜永杰 田云龙 
国家重点研发计划项目(2023YFF0612100);青岛市关键技术攻关及产业化示范类项目(24-1-2-qljh-19-gx)。
针对很少有人将说话人转换和情感转换结合起来研究,且实际场景中的目标说话人情感语料通常很少,不足以从头训练一个强泛化性模型的问题,提出一种融合大语言模型和预训练情感语音合成模型的少量语料说话人-情感语音转换(LSEVC)方法。首先...
关键词:少量语料 说话人-情感语音转换 大语言模型 预训练情感语音合成模型 微调 
说话人识别综述
《控制工程》2025年第2期251-264,共14页张葛祥 曾鑫 姚光乐 杨强 贾勇 朱明 
国家自然科学基金资助项目(61972324);四川省科技项目(2021YFS0313,23NSFTD0049,2021YFG0133,23ZDYF0247)。
说话人识别是一种利用人类语音中存在的与身份相关的特征来识别说话人身份的技术,也称为声纹识别。这项技术既是新一代人工智能的重要研究方向,也是计算机领域的研究热点,吸引了许多学者的关注与研究。首先,在结合以往和当前有关该领域...
关键词:说话人识别 声纹识别 说话人欺诈 深度学习 
基于多粒度时空注意力机制的说话人识别模型
《声学技术》2025年第1期93-101,共9页朱文博 吴靖 金浩 叶维彰 朱珍 
国家自然科学基金项目号(62106048);广东省重点领域研发计划项目(2021b0101410002);广东省重点领域研发计划项目(2020b0404030001)。
深度学习已广泛应用在说话人识别领域,但当前模型存在识别率低和模型参数复杂度高的问题,难以进行轻量化语音识别。针对此问题,文章提出一种基于多粒度时空注意力机制的说话人识别模型,该模型由多粒度混合模块、时空注意力机制模块、通...
关键词:深度学习 卷积神经网络 说话人识别 注意力机制 轻量化模型 
噪声环境下基于域对抗图卷积网络和坐标注意力的说话人确认方法
《南京邮电大学学报(自然科学版)》2025年第1期57-67,共11页陈家辉 葛子瑞 王天朗 郭海燕 杨震 
国家自然科学基金(62071242)资助项目。
为了减弱背景噪声对说话人确认(Speaker Verification,SV)性能的影响,提出一种基于域对抗图卷积网络(Domain Adversarial Graph Convolution Network,DA⁃GCN)和坐标注意力(Coordinate Attention,CA)的SV方法来提升噪声环境下的SV性能。...
关键词:噪声环境 说话人确认 域对抗 坐标注意力机制 图卷积神经网络 
利用全局-局部特征依赖的反欺骗说话人验证系统
《计算机应用》2025年第1期308-317,共10页张嘉琳 任庆桦 毛启容 
国家自然科学基金面上项目(62176106);江苏大学应急管理学院专项科研项目(KY-A-01)。
针对现有卷积模型为主的反欺骗说话人验证系统捕获全局特征依赖不理想的问题,提出一种利用全局-局部特征依赖的反欺骗说话人验证系统。首先,对于欺骗语音检测模块,设计两种滤波器组合方式对原始语音进行滤波,并通过对频率子带的掩蔽实...
关键词:说话人验证 数据增强 频率掩蔽 注意力机制 欺骗语音检测 
检索报告 对象比较 聚类工具 使用帮助 返回顶部