说话人识别

作品数:888被引量:2091H指数:17
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:杨莹春吴朝晖刘加赵力景新幸更多>>
相关机构:浙江大学清华大学南京邮电大学中国科学技术大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划江苏省自然科学基金国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程x
条 记 录,以下是1-10
视图:
排序:
基于尺度相关-双向长短期记忆网络模型的说话人识别被引量:1
《计算机工程》2023年第4期289-296,共8页曹书鑫 冯藤藤 葛凤培 梁春燕 
国家自然科学基金(11704229)。
说话人识别通过语音对说话人进行身份认证,然而大部分语音在时域与频域具有分布多样性,目前说话人识别中的卷积神经网络深度学习模型普遍使用单一的卷积核进行特征提取,无法提取尺度相关特征及时频域特征。针对这一问题,提出一种尺度相...
关键词:说话人识别 深度学习 尺度相关卷积 感受野 长短期记忆网络 
一种适用于说话人识别的改进Mel滤波器被引量:8
《计算机工程》2013年第11期214-217,222,共5页项要杰 杨俊安 李晋徽 陆俊 
国家自然科学基金资助项目(60872113)
Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适...
关键词:说话人识别 MEL倒谱系数 个性信息 反Mel倒谱系数 频谱分布 语音信号 
基于发声机理与人耳感知特性的说话人识别被引量:3
《计算机工程》2013年第11期197-199,204,共4页杜晓青 于凤芹 
国家自然科学基金资助项目(61075008)
Mel频率倒谱系数(MFCC)与线性预测倒谱系数(LPCC)融合算法只能反映语音静态特征,且LPCC对语音低频局部特征描述不足。为此,提出将希尔伯特黄变换(HHT)倒谱系数与相对光谱-感知线性预测倒谱系数(RASTA-PLPCC)融合,得到一种既反映发声机...
关键词:说话人识别 发声机理 人耳感知特性 希尔伯特黄变换倒谱系数 感知线性预测倒谱系数 RELATIVE Spectra滤波 
基于共性特征选择的短时说话人识别方法
《计算机工程》2012年第24期171-174,178,共5页肖星星 冯瑞 
上海市教育委员会科研创新基金资助项目(11CXY01;11CXY03)
现有说话人识别方法在短时语音条件下识别性能明显下降。为此,提出一种基于共性特征选择的短时说话人识别方法。利用说话人语音数据得到高斯混合模型,提取说话人之间的公共重叠部分,建立共性重叠模型和非重叠模型,根据这2个模型完成测...
关键词:家用机器人 高斯混合模型 特征选择 共性特征 短时说话人 短时语音 
基于SVM的说话人识别参数选择方法被引量:5
《计算机工程》2012年第21期175-177,共3页徐晨 曹辉 赵晓 
国家自然科学基金资助项目(11074159)
针对支持向量机(SVM)计算复杂度高的问题,采用归一化和主元分析变换算法对语音数据进行预处理,并把K倍交叉验证与网络搜索法相结合应用到语音识别中。分析结果表明,与遗传算法和粒子群优化算法相比,该方法可以在识别率基本不变的情况下...
关键词:支持向量机 说话人识别 主元分析 交叉验证 归一化 
基于Gammatone滤波器组的听觉特征提取被引量:30
《计算机工程》2012年第21期168-170,174,共4页胡峰松 曹孝玉 
目前主流说话人特征参数在噪声环境中的鲁棒性较差。为此,提出一种可用于说话人识别的听觉倒谱特征系数。分析人耳听觉模型的工作机理,采用Gammatone滤波器组代替传统的三角滤波器组模拟人耳耳蜗的听觉模型,用指数压缩代替固定的对数压...
关键词:说话人识别 特征提取 Gammatone滤波器 听觉模型 倒谱系数 鲁棒性 
家用机器人的说话人识别系统被引量:1
《计算机工程》2012年第2期207-209,212,共4页武宁 肖星星 冯瑞 
国家"863"计划基金资助项目(2009AA01A346);上海市科委科技攻关计划基金资助项目(09511501404);上海宝山区科委产学研基金资助项目(CXY-2009-03)
现有说话人识别系统对环境噪声及说话人声音变迁等干扰的鲁棒性较差。为此,在改进和优化高斯混合-通用背景模型的基础上,根据家庭环境中的典型特征,设计并实现一种用于家用机器人的说话人识别系统。应用结果表明,该系统具有较好的识别...
关键词:说话人识别 家用机器人 梅尔频率倒谱系数 高斯混合模型 通用背景模型 
基于SVM-GMM的开集说话人识别方法被引量:5
《计算机工程》2011年第14期172-174,177,共4页陈黎 徐东平 
建立一种支持向量机-高斯混合模型(SVM-GMM),用以提高开集说话人识别的识别率。该模型的基本思想是将SVM的分类结果用GMM模型进行确认。由于SVM模型具有较好的分类性能,而GMM模型能够较好地描述类别内部的相似性,因此这2个模型的组合能...
关键词:支持向量机 高斯混合模型 开集说话人识别 等误识率 
基于保局部核RVM的说话人识别方法被引量:1
《计算机工程》2011年第14期208-210,共3页郑泽萍 王万良 郑建炜 
国家自然科学基金资助项目(61070043)
针对说话人语音特征随音量、情绪、健康等因素变化呈现出的复杂分布结构,提出一种基于保局部核相关向量机(RVM)的说话人识别方法。在RVM模型所采用的高斯核函数中引入相似度因子,以保留数据局部结构,构成保局部核RVM模型。在模型训练过...
关键词:说话人识别 保局部核 相关向量机 高斯核函数 类内相似度 
基于Bark子波变换的MFCC特征提取被引量:5
《计算机工程》2011年第11期192-194,共3页尹许梅 何选森 
湖南省湘潭市科技计划基金资助项目(ZJ20071008)
为提高低信噪比环境下语音的鲁棒性,提出一种改进的Mel频率倒谱系数(MFCC)特征提取方法。在传统MFCC特征提取的基础上,引入更适应人耳听觉系统的Bark子波变换,在快速傅里叶变换之前对语音进行预处理,并在MFCC提取方法中代替离散余弦变换...
关键词:说话人识别 MEL频率倒谱系数 Bark子波 窗函数 
检索报告 对象比较 聚类工具 使用帮助 返回顶部