说话人识别

作品数:888被引量:2091H指数:17
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:杨莹春吴朝晖刘加赵力景新幸更多>>
相关机构:浙江大学清华大学南京邮电大学中国科学技术大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划江苏省自然科学基金国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程与设计x
条 记 录,以下是1-10
视图:
排序:
基于分层注意力特征融合的说话人识别
《计算机工程与设计》2024年第11期3413-3419,共7页赵宏 高楠 王伟杰 杨昌东 
国家自然科学基金项目(62166025);甘肃省重点研发计划基金项目(21YF5GA073)。
为缓解现有说话人识别模型提取的说话人特征可靠性不强,融合特征时不同尺度特征关联性不高的问题,研究一种基于分层注意力特征融合网络(hierarchical attention feature fusion network,HAFF-Net)的说话人识别算法。利用卷积和池化操作...
关键词:说话人识别 分层注意力 平均协调注意力 注意力特征融合 多尺度特征 附加角裕度损失函数 端到端 
基于迁移学习双阶段训练的情感语音克隆技术
《计算机工程与设计》2024年第5期1533-1540,共8页李囡 郭浩 相洁 
国家自然科学基金项目(61876124、61873178);山西省科技厅基础研究基金项目(20210302123129、20210302124166、20210302123099)。
为解决传统基于SV2TTS架构的语音克隆系统合成语音缺乏丰富表达能力的问题,提出一种基于迁移学习双阶段训练说话人编码器的情感语音克隆方法。在说话人识别技术基础上,利用迁移学习,对说话人编码器进行音色克隆训练;在情感克隆训练阶段...
关键词:迁移学习 情感语音克隆 情感语音合成 双阶段训练 说话人识别 说话人编码 参数微调 
双模态融合特征下的说话人识别
《计算机工程与设计》2023年第8期2454-2458,共5页谢娅利 庞炜千 白静 薛珮芸 赵建星 师晨康 
山西省应用基础研究计划基金项目(201901D111094);山西省留学回国人员科技活动择优基金项目(20200017);山西省应用基础研究计划基金项目(青年基金20210302124544)。
为提高说话人识别的准确率,提出一种双模态融合特征的算法。提取韵律特征和伽玛通滤波倒谱系数两种声学特征,计算其统计特性;提取舌、唇和下颌分别相对于鼻梁的发音动作参数,获得参考点发音动作特征;将声学特征和参考点发音动作特征进...
关键词:韵律特征 伽玛通滤波倒谱系数 发音动作特征 特征融合 特征选择 高斯混合模型-支持向量机 说话人识别 
基于深度双向LSTM网络的说话人识别被引量:6
《计算机工程与设计》2020年第6期1768-1772,共5页王华朋 
2017国家重点研发计划基金项目(2017YFC0821000);2016国家社会科学基金重点基金项目(16AYY015);辽宁省重点研发计划基金项目(2017231006、2017231004);公安部公安理论及软科学基金项目(2017LLYJXJXY040);重庆市高校刑事科学技术重点实验室(西南政法大学)开放基金项目(XKZDSYS2019-Z1);上海市现场物证重点实验室开放课题基金项目(2018XCWZK09)。
为进一步提高说话人识别的准确率,提出一种基于深度双向长短时记忆(long short-term memory,LSTM)网络的说话人识别方法,实现文本无关端到端的说话人身份识别。双向利用语音的序列数据,通过记忆单元,增强上下层之间的联系,提高对语音序...
关键词:长短时记忆 端到端 说话人识别 深度学习 循环神经网络 
说话人识别的不确定性i-vector分析被引量:5
《计算机工程与设计》2017年第6期1647-1650,共4页屈召贵 鲁顺昌 
四川省教育厅科研基金项目(16ZA0424);四川工商学院创新科研基金项目(2013cscdky0046)
针对噪声环境中说话人识别性能不稳定问题,提出一种基于不确定性前端因子分析的说话人识别方法。通过不确定性估计改进传统的i-vector特征抽取方式,实现在噪声环境中性能稳定的说话人识别。实验结果表明,该方法具有较高的说话人识别准确...
关键词:说话人识别 不确定性 鲁棒性 i-vector 前端因子分析 
基于改进PNCC和i-vector的说话人识别鲁棒性被引量:3
《计算机工程与设计》2017年第4期1071-1075,共5页史小元 景新幸 曾敏 杨海燕 
广西区自然科学基金项目(2012GXNSFAA053221);广西千亿元产业产学沿用合作基金项目(信科院0168)
针对传统的梅尔频率倒谱系数(MFCC)在说话人识别系统中鲁棒性不足的问题,提出一种基于改进幂率归一化倒谱系数(PNCC)特征算法和身份向量(i-vector)训练模型的方法。与传统的MFCC不同,PNCC利用长时帧估计背景噪声;在此基础上,通过多窗谱...
关键词:幂率归一化倒谱系数 身份向量 均值方差归一化 多窗谱估计 鲁棒性 说话人识别 
说话人识别中改进特征提取算法的研究被引量:3
《计算机工程与设计》2014年第5期1772-1775,1781,共5页宋乐 白静 
国家自然科学基金项目(61072087);山西省科技攻关基金项目(20120313013-6)
为了提取到能够区分不同说话人个性特征的最优特征参数,采用在Mel频率倒谱系数(Mel-frequency cepstrum coefficients,MFCC)基础上进行改进的复合参数,即增加归一化短时能量参数和一阶差分所构成的特征矢量作为特征。针对高维特征参数,...
关键词:说话人识别 特征提取 归一化短时能量 梅尔倒谱复合参数 相关距离Fisher准则 
采用熵相关性优化分离性的SVM说话人识别
《计算机工程与设计》2011年第8期2845-2848,共4页刘晋胜 
针对目前说话人识别模型精度不高,应用性不强的缺点,提出一种采用熵相关性优化原始特征参数的方法,并综合特征熵相关性和原始特征特性值两方面因素改进了说话人识别的分离性测度。以说话人聚类类间差异最大化为目标,建立围绕基于特征分...
关键词:说话人识别 支持向量机  相关性 分离性测度 
用于神经网络说话人识别的PCA-GA研究被引量:2
《计算机工程与设计》2009年第19期4503-4505,共3页俞利强 马道钧 
针对用于神经网络说话人识别的海量特征参数带来的识别率和网络训练稳定性的问题,提出了一种用于神经网络的基于语音特征参数的PCA新方法。该方法提取出的新特征参数在神经网络中的识别率和训练速度得到较大提高。结合GA能有效防止网络...
关键词:主成分分析 线性预测倒谱系数 美尔频率倒谱系属 遗传算法 BP网络 
基于MFCC和LPCC的说话人识别被引量:48
《计算机工程与设计》2009年第5期1189-1191,共3页余建潮 张瑞林 
浙江省自然科学基金项目(Y106148)。
MFCC参数和LPCC参数是说话人识别中两种最常用的特征参数,研究了MFCC和LPCC参数提取的算法原理及差分倒谱参数的提取方法,采用MFCC、LPCC及其一阶、二阶差分作为特征参数,通过k均值算法与三层BP神经网络来进行说话人识别。实验结果表明...
关键词:LPCC MFCC 特征提取 说话人识别 神经网络 K均值算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部