说话人识别

作品数:888被引量:2091H指数:17
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:杨莹春吴朝晖刘加赵力景新幸更多>>
相关机构:浙江大学清华大学南京邮电大学中国科学技术大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划江苏省自然科学基金国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机应用x
条 记 录,以下是1-10
视图:
排序:
基于概率球面判别分析的说话人识别信道补偿算法
《计算机应用》2024年第2期556-562,共7页景维鹏 肖庆欣 罗辉 
国家自然科学基金资助项目(62101114)。
在说话人识别任务中,概率线性判别分析(PLDA)模型是目前常用的分类后端,但由于高斯PLDA模型分布假设不能准确拟合真实说话人特征分布,导致基于高斯分布假设长度归一化的信道补偿方法会破坏说话人特征类内分布的独立性,使得高斯PLDA不能...
关键词:说话人识别 i-vector 概率球面判别分析 信道补偿 冯·米塞斯-费希尔分布 长度归一化 
基于时域波形的半监督端到端虚假语音检测方法被引量:2
《计算机应用》2023年第1期227-231,共5页方昕 黄泽鑫 张聿晗 高天 潘嘉 付中华 高建清 刘俊华 邹亮 
科技创新2030——“新一代人工智能”重大项目(2020AAA0103600)。
现代语音合成和音色转换系统产生的虚假语音对自动说话人识别系统构成了严重威胁。大多数现有的虚假语音检测系统对在训练中已知的攻击类型表现良好,但对实际应用中的未知攻击类型检测效果显著降低。因此,结合最近提出的双路径Res2Net(D...
关键词:虚假语音检测 语音合成 音色转换 说话人识别 时域 半监督学习 
基于听皮层神经元感受野的强噪声环境下说话人识别被引量:3
《计算机应用》2020年第10期3034-3040,共7页牛晓可 黄伊鑫 徐华兴 蒋震阳 
国家自然科学基金资助项目(11804309)。
针对说话人识别易受环境噪声影响的问题,借鉴生物听皮层神经元频谱-时间感受野(STRF)的时空滤波机制,提出一种新的声纹特征提取方法。在该方法中,对基于STRF获得的听觉尺度-速率图进行了二次特征提取,并与传统梅尔倒谱系数(MFCC)进行组...
关键词:听皮层 频谱-时间感受野 梅尔倒谱系数 含噪说话人识别 支持向量机 
基于多特征i-vector的短语音说话人识别算法被引量:6
《计算机应用》2018年第10期2839-2843,共5页孙念 张毅 林海波 黄超 
重庆市基础科学与前沿技术研究专项重点项目(cstc2015jcyjBX0066)~~
当测试语音时长充足时,单一特征的信息量和区分性足够完成说话人识别任务,但是在测试语音很短的情况下,语音信号里缺乏充分的说话人信息,使得说话人识别性能急剧下降。针对短语音条件下的说话人信息不足的问题,提出一种基于多特征i-vec...
关键词:说话人识别 i-vector 短语音 多特征 主成分分析 线性判别分析 
基于SIFT的说话人唇动识别被引量:2
《计算机应用》2017年第9期2694-2699,共6页马新军 吴晨晨 仲乾元 李园园 
国家自然科学基金资助项目(51677035);深圳市基础研究项目(JCYJ20150513151706580);深圳市科技计划项目(GRCK2016082611021550)~~
针对唇部特征提取维度过高以及对尺度空间敏感的问题,提出了一种基于尺度不变特征变换(SIFT)算法作特征提取来进行说话人身份认证的技术。首先,提出了一种简单的视频帧图片规整算法,将不同长度的唇动视频规整到同一的长度,提取出具有代...
关键词:唇部特征 尺度不变特征变换 特征提取 说话人识别 
基于MAP+CMLLR的说话人识别中发声力度问题被引量:1
《计算机应用》2017年第3期906-910,共5页黄文娜 彭亚雄 贺松 
贵州省社会攻关计划项目(黔科合SY字[2013]3105号);贵州省工程技术研究中心建设项目(黔科合G字[2014]4002号)~~
为了改善发声力度对说话人识别系统性能的影响,在训练语音存在少量耳语、高喊语音数据的前提下,提出了使用最大后验概率(MAP)和约束最大似然线性回归(CMLLR)相结合的方法来更新说话人模型、投影转换说话人特征。其中,MAP自适应方法用于...
关键词:说话人识别 发声力度 最大后验概率 最大似然线性回归 约束最大似然线性回归 
SMFCC:一种新的语音信号特征提取方法被引量:4
《计算机应用》2016年第6期1735-1740,共6页汪海彬 余正涛 毛存礼 郭剑毅 
国家自然科学基金资助项目(61262041;61472168);云南省自然科学基金重点项目(2013FA030)~~
针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC).该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD...
关键词:S变换 奇异值分解 基于S变换的美尔倒谱系数 高斯混合模型-通用背景模型 说话人识别 
基于卷积神经网络的说话人识别算法被引量:13
《计算机应用》2016年第A01期79-81,200,共4页胡青 刘本永 
国家自然科学基金资助项目(60862003);科技部国际合作项目(2009DFR10530);贵州省工业科技攻关项目(黔科合GY字(2010)2054);教育部高等院校博士点基金资助项目(20095201110002);贵州大学研究生创新基金资助项目(2015081)
语音信号是一个时变信号,受个体、环境等影响较大。为提高说话人识别率,对原始语音信号进行一定预处理是必要的,提出一种利用卷积神经网络的说话人识别算法。该算法利用卷积神经网络的卷积和降采样两种操作对说话人识别中的语音信号进...
关键词:卷积神经网络 说话人识别 通用背景模型 梅尔频率倒谱系数 预处理 
一种改进的听觉特征参数应用于说话人识别被引量:5
《计算机应用》2016年第A01期82-85,共4页熊冰峰 曾以成 谢小娟 
针对主流的语音特征参数梅尔频率倒谱系数(MFCC)和伽马通倒谱系数(GFCC)作为说话人个性特征,在低信噪比的环境下,说话人识别率下降较快的问题,提出一种改进的听觉特征参数应用于说话人识别。在语音信号预处理过程中,提出一种汉明自卷积...
关键词:说话人识别 频谱泄露 汉明自卷积窗 全极点Gammatone滤波器 高斯混合模型 
说话人识别中基于Fisher比的特征组合方法被引量:3
《计算机应用》2016年第5期1421-1425,共5页谢小娟 曾以成 熊冰峰 
国家自然科学基金资助项目(61471310)~~
为了提高说话人识别的准确率,可以同时采用多个特征参数,针对综合特征参数中各维分量对识别结果的影响可能不一样,同等对待并不一定是最优的方案这个问题,提出基于Fisher准则的梅尔频率倒谱系数(MFCC)、线性预测梅尔倒谱系数(LPMFCC)、T...
关键词:说话人识别 FISHER准则 梅尔频率倒谱系数 线性预测系数 TEAGER能量算子 
检索报告 对象比较 聚类工具 使用帮助 返回顶部