说话人识别

作品数:888被引量:2091H指数:17
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:杨莹春吴朝晖刘加赵力景新幸更多>>
相关机构:浙江大学清华大学南京邮电大学中国科学技术大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划江苏省自然科学基金国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机与数字工程x
条 记 录,以下是1-10
视图:
排序:
基于改进时延神经网络的说话人识别方法
《计算机与数字工程》2023年第12期2827-2830,共4页胡贵超 
提出了一种改进的时延神经网络(Time Delay Neural Network,TDNN)的说话人识别方法以提高说话人识别准确率。首先通过TDNN网络训练音频的特征获取部分说话人的特征表达,然后由加入的量化和计数算子(Quantization and Counting Operators...
关键词:说话人识别 时延神经网络 量化和计数算子 qco-vector 
基于模型聚类的说话人识别研究
《计算机与数字工程》2023年第8期1745-1749,1831,共6页陈秉沃 张二华 唐振民 
随着说话人识别技术的广泛应用,说话人规模不断增长,若采用传统的说话人辨别方式逐一比较,则计算量较大,难以实时响应,使说话人识别系统的性能与实用性大大降低。传统的K-L散度距离由于非对称性,并不是一种很好的聚类距离度量,聚类效果...
关键词:模型聚类 推土机距离 Wasserstein distance 说话人识别 高斯混合模型 
基于Bi-GRU+BFE模型的短语音说话人识别被引量:2
《计算机与数字工程》2022年第10期2233-2239,共7页姜珊 张二华 张晗 
军委装备发展部十三五装备预研领域基金项目(编号:61403120102)资助。
说话人识别作为一种重要的生物特征识别技术,已得到广泛应用。由于实际应用中获取的说话人语音长度有限,如何提高语音特征的短时性能,使声纹识别在短语音上取得较高的准确率,仍然是一大难点。对此,论文研究了一种双向门控循环单元(Bidir...
关键词:说话人识别 短语音 双向门控循环单元 块级特征均衡 梅尔频率倒谱系数 
基于对抗不变性解散的说话人识别
《计算机与数字工程》2022年第4期833-838,共6页黄多林 刘栋 郑智燊 
江苏省大学生创新创业项目(编号:201810299045Z)资助。
为提高说话人识别模型的性能,论文提出一种新颖的方法来提取具有鲁棒性的说话人可区分性特征。该方法将说话人映射到两个较低维度的嵌入空间,通过解散对抗和注意力机制,其中一个嵌入空间完成从语音信号的所有其他信息中解散出说话人相...
关键词:说话人识别 深度学习 注意力机制 对抗不变性解散 
基于小波包的回放语音检测算法被引量:1
《计算机与数字工程》2022年第2期238-242,441,共6页汤爽 张二华 唐振民 
南京理工大学社会公共安全科技协同创新中心开放项目(编号:KY201706)资助。
以便携式回放设备的语音为代表的假冒语音攻击,给说话人识别系统带来了严峻的挑战。针对这种回放语音攻击问题,论文提出一种基于小波包的多频带回放语音鉴别算法。首先,通过小波包分解及重构后的信号进行傅里叶变换,取每一帧频谱的最大...
关键词:小波包分解 回放语音检测 高斯混合模型 说话人识别 
多人会话混合语音的说话人分割
《计算机与数字工程》2020年第7期1558-1563,1622,共7页李艳妮 张二华 
军委装备发展部十三五装备预研领域基金项目(编号:61403120102)资助。
利用说话人信息自动管理海量混合语音是一个重要的研究课题,为了提高多人会话场景下短语音的说话人分割正确率,论文研究了一种基于高斯混合模型和多尺度分析的说话人分割算法。在提高短语音说话人识别率的基础上,该算法综合使用端点检...
关键词:短语音 说话人分割 高斯混合模型 多尺度分析 说话人识别 
基于PLDA信道补偿的说话人识别算法被引量:2
《计算机与数字工程》2019年第11期2757-2762,共6页茅正冲 王俊俊 黄舒伟 
国家自然科学基金(编号:60973095);江苏省产学研联合创新资金-前瞻性联合研究(编号:BY201519-29)资助
近年来,针对说话人识别算法普遍受到信道因素的干扰问题,研究者提出使用总变化因子分析的识别方法对语音信道进行补偿得到了很不错的效果,其中概率线性判别分析(Probabilistic Linear Discriminant Analysis,PLDA)因其表现优异而受到学...
关键词:信道补偿 线性判别分析 I-Vector GMM/UBM NIST SRE-2010 
基于深度学习及核典型相关分析的多特征融合说话人识别被引量:2
《计算机与数字工程》2019年第9期2185-2189,2205,共6页卜禹 陆璐璐 
论文提出一种基于深度学习以及核典型相关分析(kernel canonical correlation analysis,CCA)的多特征融合说话人识别方法。针对说话人的音频和视频信息,利用深度信念网络和卷积神经网络这两种不同深度的神经网络对音频信息和视频信息分...
关键词:深度信念网络 卷积神经网络 核典型关联分析 最近邻分类器 说话人识别 
Android平台下OpenCL加速的说话人识别系统
《计算机与数字工程》2019年第7期1725-1727,1826,共4页张竞丹 韩俊刚 
如今,人工智能正在图像、自然语言处理等诸多领域迅速发展,同时随着移动设备的广泛使用,人们的生活习惯正在逐步的改变。所以,将人工智能技术运用到移动互联网中已经成为必然趋势。但由于移动设备因密集的计算带来的功耗提升和存储带宽...
关键词:说话人识别 OPENCL ANDROID MFCC特征 BP神经网络 
端点检测对说话人识别的影响被引量:2
《计算机与数字工程》2014年第6期984-987,共4页顾秀秀 赵玉晓 张二华 
由于在说话人识别研究中发现,语音信号包括静音段、辅音段和浊音段,说话人的个性特征主要蕴含在浊音段中,静音段与辅音段参与识别会明显降低说话人的识别率。同时大量的实验证明,使用端点检测去掉静音段和辅音段后识别率有明显的提升,...
关键词:端点检测 特征提取 短时能量 短时过零率 MEL频率倒谱参数 
检索报告 对象比较 聚类工具 使用帮助 返回顶部