文本无关说话人识别

作品数:11被引量:27H指数:4
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:韩纪庆周长锋王秋雯王昌昌陈晨更多>>
相关机构:哈尔滨工业大学中国科学技术大学中山大学燕山大学更多>>
相关期刊:《电子与信息学报》《计算机工程》《自动化学报》《电子测量技术》更多>>
相关基金:国家自然科学基金中国博士后科学基金江苏省高校自然科学研究项目中央级公益性科研院所基本科研业务费专项更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
文本无关说话人识别中句级特征提取方法研究综述被引量:7
《自动化学报》2022年第3期664-688,共25页陈晨 韩纪庆 陈德运 何勇军 
国家自然科学基金(62101163);黑龙江省自然科学基金(LH2021F029);中国博士后科学基金(2021M701020);黑龙江省博士后专项经费(LBH-Z20020);黑龙江省普通高校基本科研业务费专项资金(2020-KYYWF-0341)资助。
句级(Utterance-level)特征提取是文本无关说话人识别领域中的重要研究方向之一.与只能刻画短时语音特性的帧级(Frame-level)特征相比,句级特征中包含了更丰富的说话人个性信息;且不同时长语音的句级特征均具有固定维度,更便于与大多数...
关键词:说话人识别 句级特征提取 任务分段式策略 任务驱动式策略 联合学习 
文本无关说话人识别的一种多尺度特征提取方法被引量:5
《电子与信息学报》2021年第11期3266-3271,共6页陈志高 李鹏 肖润秋 黎塔 王文超 
国家自然科学基金(11590772,11590774,11590770)。
近些年来,多种基于卷积神经网络(CNNs)的模型结构表现出越来越强的多尺度特征表达能力,在说话人识别的各项任务中取得了持续的性能提升。然而,目前大多数方法只能利用更深更宽的网络结构来提升性能。该文引入一种更高效的多尺度说话人...
关键词:说话人识别 多尺度特征 鲁棒性 高效性 
基于LPBMFCC的文本无关说话人识别被引量:1
《电子测量技术》2020年第19期169-176,共8页毛文青 管业鹏 
国家自然科学基金(11176016,60872117);高等学校博士学科点专项科研基金(20123108110014)项目资助。
为了解决特定说话人的高频信息无法被完全提取的问题,提出了一种新型的提取声道特征的方法,用于文本无关的说话人识别。首先提出了一组基于线性预测的梅尔频率倒谱系数(LPBMFCC)来消除干扰听觉能力的高频谐波,以区分两种不同的纯音,导...
关键词:说话人识别 声道特征 声源特征 融合频率倒谱系数 时频特征 
基于分类器与阵列搜索算法的文本无关说话人识别
《微电子学与计算机》2009年第4期43-46,共4页戚银城 柴君 赵振东 
基于小波神经网络的原理对与文本无关的说话人进行了识别.通过分析网络结构,提出了优化网络初始参数的方法,加快了小波网络的收敛速度;采用分组器与阵列搜索算法相结合,减少了识别时的搜索时间.实验结果表明该识别系统能大大提高识别人...
关键词:说话人识别 小波神经网络 初始值 阵列神经网络 
一种GMM对数似然得分变换方法
《电子质量》2009年第1期8-9,12,共3页冷自强 王金明 
基于高斯混合模型(GMM)的说话人识别方法通常采用对数似然得分作为测试时判定目标说话人的依据。文章在分析对数似然得分特点的基础上,提出了一种改进方法,提高了测试语音帧对于目标模型和非目标模型得分的相对差值。基于TIMIT数据库的...
关键词:文本无关说话人识别 高斯混合模型 对数似然得分 
采用遗传算法的文本无关说话人识别被引量:1
《计算机辅助工程》2008年第3期69-71,共3页陈良柱 王健 
国家自然科学基金(60573172);SUN和AMD公司资助项目
为解决在说话人识别方法的矢量量化(Vector Quantization,VQ)系统中,K-均值法的码本设计很容易陷入局部最优,而且初始码本的选取对最佳码本设计影响很大的问题,将遗传算法(Genetic Algorithm,GA)与基于非参数模型的VQ相结合,得到1种VQ...
关键词:说话人识别 GA-K算法 K-均值法 码本设计 遗传算法 矢量量化 美尔倒谱因数 
基于自适应补偿的文本无关说话人识别
《计算机仿真》2008年第6期277-280,共4页陈妮 盛利元 肖小清 袁益民 
基于高斯混合模型的文本无关说话人识别系统通常采用最大似然算法。在纯净语音环境下,基于这种算法的说话人识别系统具有较好的性能。当系统的训练环境和测试环境失配时,这种算法的误识率急剧上升。针对帧似然概率的统计特性,提出了一...
关键词:说话人识别 高斯混合模型 自适应得分补偿 
文本无关说话人识别中一种改进的模型PCA变换方法被引量:3
《电子与信息学报》2007年第2期469-472,共4页姚志强 周曦 戴蓓蒨 
国家自然科学基金(60272039)资助课题
对于采用高斯混合模型(GMM)的与文本无关的说话人识别,出于模型参数数量和计算量的考虑GMM的协方差矩阵通常取为对角矩阵形式,并假设观察矢量各维之间是不相关的。然而,这种假设在大多情况下是不成立的。为了使观察矢量空间适合于采用...
关键词:话者识别 PCA 模型PCA 解相关 
概率神经网络在文本无关说话人识别中的应用被引量:1
《北京工商大学学报(自然科学版)》2007年第1期49-51,共3页周长锋 韩力群 
采用基于听觉特性的Mel频率倒谱系数作为说话人识别特征参数,对概率神经网络进行了描述,并使用该网络进行了文本无关说话人识别研究.实验表明,对20名说话人,用7秒语音训练,3秒语音识别时,该方法可达到96.7%的正确识别率.
关键词:说话人识别 MEL频率倒谱系数 概率神经网络 
文本无关说话人识别的全特征矢量集模型及互信息评估方法被引量:7
《声学学报》2005年第6期536-541,共6页俞一彪 王朔中 
国家自然科学基金(60172016)江苏省高校自然科学基金(04KJA510133)资助项目
提出了一种文本无关说话人识别的全特征矢量集模型及互信息评估方法,该模型通过对一组说话人语音数据在特征空间进行聚类而形成,全面地反映了说话人语音的个性特征。对于说话人语音的似然度计算与判决,则提出了一种互信息评估方法,该算...
关键词:高斯混合模型 说话人识别 最大互信息 评估方法 特征矢量 文本无关 MEL频率倒谱系数 线性预测倒谱系数 语音数据 
检索报告 对象比较 聚类工具 使用帮助 返回顶部