说话人识别

作品数:888被引量:2091H指数:17
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:杨莹春吴朝晖刘加赵力景新幸更多>>
相关机构:浙江大学清华大学南京邮电大学中国科学技术大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划江苏省自然科学基金国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程与应用x
条 记 录,以下是1-10
视图:
排序:
特征注意力Transformer模块在3D唇语序列身份识别中的应用
《计算机工程与应用》2024年第7期141-146,共6页骈鑫洋 王瑜 张洁 
北京市自然科学基金-北京市教育委员会科技计划重点项目(KZ202110011015);国家自然科学基金(61906004)。
唇语行为是一种新兴起的生物特征识别技术,三维(three-dimensional,3D)唇语点云序列因包含真实嘴唇空间结构和运动信息,已成为个体身份识别的重要生物特征。但是,3D点云的无序与非结构化的特点导致时空特征的提取非常困难。为此,提出一...
关键词:说话人识别 TRANSFORMER PointNet++ 三维唇语点云 
改进Res2Net的多尺度端到端说话人识别系统被引量:5
《计算机工程与应用》2023年第24期110-120,共11页邓力洪 邓飞 张葛祥 杨强 
国家自然科学基金(61972324);四川省科技计划(2021YFS0313,2021YFG0133)。
说话人识别系统中轻量卷积神经网络的特征提取能力弱、识别效果差。而为了提升特征提取能力,许多方法使用了更深、更宽、更复杂的网络结构,使得参数量和推理时间成倍增加。将目标检测任务中的轻量网络Res2Net引入到说话人识别任务中,验...
关键词:说话人识别 端到端 注意力机制 
时空梯度迭代的声纹对抗攻击算法STI-FGSM
《计算机工程与应用》2023年第21期151-158,共8页李烁 顾益军 谭昊 
公安部科技强警基础工作专项项目(2020GABJC02);中国人民公安大学基本科研业务费项目(2021JKF420)。
为了解决当前声纹对抗攻击算法梯度信息利用不足、迁移性较差等问题,针对说话人识别模型,提出一种时空迭代快速梯度符号法(space-time iterative fast gradient sign method,STI-FGSM)的声纹对抗攻击算法。该算法基于动量迭代快速梯度...
关键词:说话人识别 对抗攻击 梯度 扰动集成 白盒攻击 黑盒攻击 迁移性 
改进Xception网络的声纹对抗检测研究被引量:1
《计算机工程与应用》2023年第14期232-241,共10页李烁 顾益军 谭昊 彭舒凡 
公安部科技强警基础工作专项项目(2020GABJC02);中国人民公安大学基本科研业务费项目(2021JKF420)。
近年来,针对说话人识别模型的对抗攻击引起了广泛的关注,对说话人识别系统的安全构成了严重的威胁。为了解决现有的声纹对抗样本检测方法参数量过大、鲁棒性差的问题,提出一个声纹对抗样本检测模型e_Xception,该模型以Xception为主干网...
关键词:说话人识别 对抗攻击 对抗检测 Xception网络 数据增强 鲁棒性 
两级特征联合学习的情感说话人识别
《计算机工程与应用》2023年第1期149-155,共7页刘金琳 李冬冬 王喆 蔡立志 
国家自然科学基金(61806078);国家重大新药开发科技专项(2019ZX09210004);上海市教育发展基金会和上海市教育委员会“曙光计划”(61725301)。
针对说话人识别的性能易受到情感因素影响的问题,提出利用片段级别特征和帧级别特征联合学习的方法。利用长短时记忆网络进行说话人识别任务,提取时序输出作为片段级别的情感说话人特征,保留了语音帧特征原本信息的同时加强了情感信息...
关键词:情感说话人识别 长短时记忆网络 深度神经网络 
深度学习框架下说话人识别研究综述被引量:10
《计算机工程与应用》2020年第7期8-16,共9页曾春艳 马超峰 王志锋 朱栋梁 赵楠 王娟 刘聪 
湖北省教育厅科学技术研究项目(No.Q20191406);国家自然科学基金(No.61901165,61501199);湖北省自然科学基金(No.2017CFB683)。
说话人识别由于其独特的方便性、经济性和准确性等优势,已成为人们日常生活与工作中重要的身份认证方式。然而在实际应用场景下,对说话人识别系统的准确性、鲁棒性、迁移性、实时性等提出了巨大的挑战。近年来深度学习在特征表达和模式...
关键词:说话人识别 深度学习 特征表达 模式分类 端到端 
基于DNN处理的鲁棒性I-Vector说话人识别算法被引量:12
《计算机工程与应用》2018年第22期167-172,共6页王昕 张洪冉 
江苏省自然科学基金(No.BK20160915);江苏省高校自然科学研究项目(No.14KJB510024)
提出了一种将基于深度神经网络(Deep Neural Network,DNN)特征映射的回归分析模型应用到身份认证矢量(identity vector,i-vector)/概率线性判别分析(Probabilistic Linear Discriminant Analysis,PLDA)说话人系统模型中的方法。DNN通过...
关键词:说话人识别 深度神经网络 i-vector 
Android平台说话人认证系统的并行计算与设计
《计算机工程与应用》2017年第3期231-236,252,共7页徐利敏 魏翔 
江苏省自然科学基金(No.BK2011832);江苏省教育厅高校自然项目(No.10KJB520007;No.11KJB520005)
智能手机技术的快速进步催生了移动商务的蓬勃发展,智能手机移动商务平台的安全性和身份认证问题已经成为移动商务能否进一步发展的关键。说话人识别技术作为一种生物识别认证技术应用到现有的智能手机中非常便利,而且有其他安全认证技...
关键词:说话人识别 认证系统 并行计算 ANDROID平台 梅尔倒谱系数 
多类型语音特征进化选择算法
《计算机工程与应用》2016年第14期150-155,219,共7页张小恒 谢文宾 李勇明 
国家自然科学基金(No.91438104);中央高校基本科研业务费专项资金(No.CDJZR10160003;No.CDJZR13160008;No.CDJZR155507);中国博士后科学基金(No.2013M532153);重庆市博士后科研项目特别资助
基于特征选择的语音特征获取用于说话人识别是目前较为有效的方式。但是,最优语音特征随着具体应用环境的变化而不同。因此,提出了基于四类型语音特征封装式遗传特征选择算法(FSF-Wr GAF),该算法提取了四种类型的语音特征参数,通过链式...
关键词:说话人识别 多类型语音特征 链式智能体遗传算法 伽马通滤波器倒谱系数(GFCC) 梅尔频率倒谱系数(MFCC) 线性预测倒谱系数(LPCC) 
加权成对约束度量学习在说话人识别中的应用被引量:2
《计算机工程与应用》2016年第11期158-163,共6页罗剑 杨印根 雷震春 
国家自然科学基金(No.61365004);江西省教育厅科学技术研究项目(No.GJJ12198)
I-vector说话人识别系统常用距离来衡量说话人语音间的相似度。加权成对约束度量学习算法(WPCML)利用成对训练样本的加权约束信息训练一个用于计算马氏距离的度量矩阵。该度量矩阵表示的样本空间中,同类样本间的距离更小,非同类样本间...
关键词:说话人识别 马氏距离 距离度量学习 机器学习 模式识别 
检索报告 对象比较 聚类工具 使用帮助 返回顶部