刘文举

作品数:32被引量:251H指数:7
导出分析报告
供职机构:中国科学院自动化研究所更多>>
发文主题:语音识别信号子空间语音汉语麦克风阵列更多>>
发文领域:电子电信自动化与计算机技术语言文字理学更多>>
发文期刊:《计算机应用研究》《声学学报》《电子学报》《计算机工程》更多>>
所获基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划北京市自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于优化卷积神经网络结构的交通标志识别被引量:18
《计算机应用》2017年第2期530-534,共5页王晓斌 黄金杰 刘文举 
国家自然科学基金资助项目(61573357;61503382;61403370;61273267)~~
现有算法对交通标志进行识别时,存在训练时间短但识别率低,或识别率高但训练时间长的问题。为此,综合批量归一化(BN)方法、逐层贪婪预训练(GLP)方法,以及把分类器换成支持向量机(SVM)这三种方法对卷积神经网络(CNN)结构进行优化,提出基...
关键词:卷积神经网络 批量归一化 贪婪预训练 支持向量机 
基于深度学习语音分离技术的研究现状与进展被引量:72
《自动化学报》2016年第6期819-833,共15页刘文举 聂帅 梁山 张学良 
国家自然科学基金(61573357;61503382;61403370;61273267;91120303;61365006)资助~~
现阶段,语音交互技术日益在现实生活中得到广泛的应用,然而,由于干扰的存在,现实环境中的语音交互技术远没有达到令人满意的程度.针对加性噪音的语音分离技术是提高语音交互性能的有效途径,几十年来,全世界范围内的许多研究者为此投入...
关键词:神经网络 语音分离 计算听觉场景分析 机器学习 
汉语语音识别中融合发音信息的随机段模型研究被引量:1
《计算机应用研究》2014年第11期3365-3368,共4页晁浩 杨占磊 刘文举 
国家自然科学基金资助项目(91120303;90820303;90820011);河南省基础与前沿技术研究计划资助项目(132300410332)
提出了一种基于随机段模型的发音信息集成方法。根据随机段模型的模型特性,建立了阶层式人工神经网络来获取语音段信号属于各类音素的后验概率,并通过一遍解码的方式集成到随机段模型系统中。在"863-test"测试集上进行的汉语连续语音识...
关键词:语音识别 随机段模型 发音信息 阶层式人工神经网路 发音特征 
基于最大似然线性回归的随机段模型说话人自适应研究
《计算机工程与科学》2014年第8期1604-1608,共5页晁浩 杨占磊 刘文举 
国家自然科学基金资助项目(91120303;90820303;90820011);国家973计划资助项目(2004CB318105);国家863计划资助项目(20060101Z4073;2006AA01Z194)
提出了一种随机段模型系统的说话人自适应方法。根据随机段模型的模型特性,将最大似然线性回归方法引入到随机段模型系统中。在"863-test"测试集上进行的汉语连续语音识别实验显示,在不同的解码速度下,说话人自适应后汉字错误率均有明...
关键词:语音识别 说话人自适应 最大似然线性回归 随机段模型 
基于噪声追踪的二值时频掩蔽到浮值掩蔽的泛化算法被引量:5
《声学学报》2013年第5期632-637,共6页梁山 刘文举 江巍 
国家自然科学基金(91120303;61273267;90820011)资助
虽然浮值掩蔽比二值掩蔽有更好的语音分离效果,但是由于理想浮值掩蔽难以直接估计,现有的语音分离系统通常以理想二值掩蔽估计作为计算目标。我们提出了一个二值掩蔽到浮值掩蔽的泛化算法。由于实现浮值掩蔽估计的关键在于噪声能量追踪...
关键词:噪声估计 掩蔽 二值 算法 追踪 最小均方误差估计 直接估计 时频 
汉语语音识别中声学界标点引导的随机段模型解码算法被引量:1
《计算机科学》2013年第10期208-212,共5页晁浩 杨占磊 刘文举 
国家自然科学基金(91120303;90820303;90820011);国家重点基础研究发展计划(973计划)(2004CB318105);国家高技术研究发展计划(863计划)(20060101Z4073;2006AA01Z194)资助
提出了一种随机段模型的解码优化算法。检测出具有语音学意义的界标点,根据这些界标点分析临近语音段的边界信息和声韵母类别信息,最后将这些边界信息和类别信息用于指导随机段模型的搜索过程。实验中,两种类型的界标点能较为准确地被...
关键词:语音识别 随机段模型 解码 界标点 
基于发音特征的汉语声调建模方法及其在汉语语音识别中的应用被引量:2
《计算机应用》2013年第10期2939-2944,共6页晁浩 杨占磊 刘文举 
国家自然科学基金资助项目(91120303;90820303;90820011)
发音特征表征了语音的发音方式信息,能够辅助传统的韵律特征改善声调建模的精度。在分析汉语声韵母发音特点的基础上,将发音方式划分为19类,并提出利用阶层式多层感知器计算语音信号属于各类的后验概率,作为发音特征。之后,将发音特征...
关键词:语音识别 声调建模 发音特征 阶层式多层感知机分类器 
汉语语音识别中基于音节的声学模型改进算法被引量:1
《计算机应用》2013年第6期1742-1745,共4页晁浩 杨占磊 刘文举 
国家自然科学基金资助项目(91120303,90820303,90820011);国家973计划项目(2004CB318105);国家863计划项目(20060101Z4073,2006AA01Z194)
针对汉语语音识别中协同发音现象引起的语音信号的易变性,提出一种基于音节的声学建模方法。首先建立基于音节的声学模型以解决音节内部声韵母之间的音变现象,并提出以音节内双音子模型来初始化基于音节声学模型的参数以缓解训练数据稀...
关键词:语音识别 协同发音 音变 声学建模 音节模型 
采用听觉滤波器的宽带MUSIC声源定位方法被引量:7
《声学学报》2012年第6期642-650,共9页廖逢钗 李鹏 刘文举 
国家自然科学基金项目(90820011,91120303,90820303);福建省自然科学基金项目(2009J01296)
在分析了采用短时傅里叶变换的宽带MUSIC声源定位算法(SF-MUSIC)存在问题的基础上,提出了一种采用听觉滤波器的宽带MUSIC声源定位算法(AF-MUSIC)。该算法使用听觉滤波器组对传声器阵列接收到的信号进行不等带宽分解后,在各个频率通道上...
关键词:MUSIC算法 声源定位 定位方法 滤波器 宽带 听觉 短时傅里叶变换 定位算法 
融合引导概率的语音识别解码算法研究被引量:1
《声学学报》2012年第2期209-217,共9页杨占磊 刘文举 晁浩 
国家重点基础研究发展计划(973计划)(2004CB318105);国家高技术研究发展计划(863计划)(20060101Z4073;2006AA01Z194);国家自然科学基金(90820011;60675026;90820303)资助项目
语音帧在声学特征空间中的位置信息可以辅助解码器对潜在路径进行筛选。传统的语音识别系统缺乏利用这种位置信息。针对这种不足,本文提出一种引导概率模型,用于描述语音帧属于声学特征空间不同局部的概率,并将其用于识别。使用引导概率...
关键词:语音识别系统 概率模型 解码算法 引导 位置信息 特征空间 局部空间 语音帧 
检索报告 对象比较 聚类工具 使用帮助 返回顶部