说话人识别

作品数:889被引量:2094H指数:17
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:杨莹春吴朝晖刘加赵力景新幸更多>>
相关机构:浙江大学清华大学南京邮电大学中国科学技术大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划江苏省自然科学基金国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
融合叙事单元和可靠标签的小说说话人识别框架
《计算机应用》2025年第4期1190-1198,共9页刘天宇 陶冶 鲁超峰 刘家旺 
国家重点研发计划项目(2023YFF0612100);青岛市关键技术攻关及产业化示范项目(24-1-2-qljh-19-gx)。
小说中的说话人识别(SI)旨在通过引语所在上下文判断它的说话人。这项任务对在制作有声书的过程中为不同的角色分配合适的声音有很大帮助。然而,现有方法对引语上下文的选择主要以固定窗口值为主,这种方式不够灵活,会产生冗余文段,导致...
关键词:说话人识别 自训练 伪标签 预训练 上下文 小说 
说话人识别综述
《控制工程》2025年第2期251-264,共14页张葛祥 曾鑫 姚光乐 杨强 贾勇 朱明 
国家自然科学基金资助项目(61972324);四川省科技项目(2021YFS0313,23NSFTD0049,2021YFG0133,23ZDYF0247)。
说话人识别是一种利用人类语音中存在的与身份相关的特征来识别说话人身份的技术,也称为声纹识别。这项技术既是新一代人工智能的重要研究方向,也是计算机领域的研究热点,吸引了许多学者的关注与研究。首先,在结合以往和当前有关该领域...
关键词:说话人识别 声纹识别 说话人欺诈 深度学习 
基于多粒度时空注意力机制的说话人识别模型
《声学技术》2025年第1期93-101,共9页朱文博 吴靖 金浩 叶维彰 朱珍 
国家自然科学基金项目号(62106048);广东省重点领域研发计划项目(2021b0101410002);广东省重点领域研发计划项目(2020b0404030001)。
深度学习已广泛应用在说话人识别领域,但当前模型存在识别率低和模型参数复杂度高的问题,难以进行轻量化语音识别。针对此问题,文章提出一种基于多粒度时空注意力机制的说话人识别模型,该模型由多粒度混合模块、时空注意力机制模块、通...
关键词:深度学习 卷积神经网络 说话人识别 注意力机制 轻量化模型 
基于ASP-SERes2Net的说话人识别算法
《北京工业大学学报》2025年第1期42-50,共9页令晓明 陈鸿雁 张小玉 张真 
甘肃省自然科学基金资助项目(22JR5RA332);甘肃省高等教育教学成果培育项目(2021)。
为提升说话人识别的特征提取能力,解决在噪声环境下识别率低的问题,提出一种基于残差网络的说话人识别算法——ASP-SERes2Net。首先,采用梅尔语谱图作为神经网络的输入;其次,改进Res2Net网络的残差块,并且在每个残差块后引入压缩激活(sq...
关键词:说话人识别 梅尔语谱图 Res2Net 压缩激活(squeeze-and-excitation SE)注意力模块 注意力统计池化(attention statistics pooling ASP) 附加角裕度的Softmax(additive angular margin Softmax AAM-Softmax) 
基于并行卷积和双重注意力机制的说话人识别
《微电子学与计算机》2025年第1期1-8,共8页陶佳佳 赵永钢 华杭波 孔明 梁晓瑜 
国家市场监督管理总局技术保障专项(2022YJ21);浙江省市场监督管理局科技计划(ZC2023057)。
为解决说话人识别面对多种场景造成性能变差的问题,提出了一种基于并行卷积和双重注意力机制的识别方法。该方法基于ECAPA-TDNN模型结构,对网络组件和损失函数计算模块进行了改进。首先,残差模块的改进是引入“分组”的思想,通过在残差...
关键词:说话人识别 并行连接 注意力机制 多场景数据集 
基于双路时延神经网络的说话人及性别识别
《桂林理工大学学报》2024年第4期715-721,共7页叶汉民 蒲立力 程小辉 
国家自然科学基金项目(61662017)。
为提高说话人和性别识别性能,提出一种新的时延神经网络(time delay neural network,TDNN)变体——双路时延神经网络。在网络架构层面,通过神经网络底层设置不同上下文大小时延单元捕捉说话人声纹信息特征,构建双路并行网络使得网络学...
关键词:说话人识别 性别识别 时延神经网络 通道注意力 空间注意力 
针对说话人识别对抗样本生成方法研究
《电子测量技术》2024年第22期49-57,共9页马栋林 宋佳佳 赵宏 陈伟杰 
国家自然科学基金(62166025)项目资助。
针对基于生成式的对抗样本生成方法生成的对抗样本真实性较低和攻击效果欠佳的问题,提出一种基于AdvGAN和CGAN的对抗样本生成方法ACGAN。首先,针对特定目标进行攻击,ACGAN通过在训练和攻击阶段引入额外的目标标签,生成具有针对性的频域...
关键词:对抗样本 生成器 鉴别器 门控卷积神经网络 感知损失 
基于分层注意力特征融合的说话人识别
《计算机工程与设计》2024年第11期3413-3419,共7页赵宏 高楠 王伟杰 杨昌东 
国家自然科学基金项目(62166025);甘肃省重点研发计划基金项目(21YF5GA073)。
为缓解现有说话人识别模型提取的说话人特征可靠性不强,融合特征时不同尺度特征关联性不高的问题,研究一种基于分层注意力特征融合网络(hierarchical attention feature fusion network,HAFF-Net)的说话人识别算法。利用卷积和池化操作...
关键词:说话人识别 分层注意力 平均协调注意力 注意力特征融合 多尺度特征 附加角裕度损失函数 端到端 
基于深度声纹特征转换网络的说话人识别攻击方法
《应用科学学报》2024年第5期782-794,共13页陶子钰 苏兆品 廉晨思 王年松 张国富 
安徽省重点研究与开发计划(No.202104d07020001);安徽省自然科学基金(No.2208085MF166)资助。
目前主流说话人识别(speaker identification,SID)系统的攻击方法主要基于快速梯度下降或映射式梯度下降算法,这些方法存在攻击效果不稳定、生成的攻击语音听觉质量不高等问题。为此提出一种基于深度声纹特征转换网络的自动说话人识别...
关键词:说话人识别 攻击语音 声纹特征转换 卷积神经网络 
基于深度学习的说话人确认方法研究现状及展望
《数据采集与处理》2024年第5期1062-1084,共23页李建琛 韩纪庆 
国家自然科学基金(62376071)。
随着深度学习的不断发展,说话人确认(Speaker verification)技术已经取得了长足的进步。该技术相较于其他生物特征识别技术,具有可远程操作、成本低和易于人机交互等优势,在公安刑侦、金融服务等领域展现出广泛的应用前景。本文系统综...
关键词:说话人识别 说话人确认 深度学习 领域不匹配 自监督学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部