国家高技术研究发展计划(2001AA114071)

作品数:21被引量:52H指数:4
导出分析报告
相关作者:王作英肖熙任纪生吴及孙健更多>>
相关机构:清华大学北京航空航天大学更多>>
相关期刊:《数据采集与处理》《中文信息学报》《计算机学报》《计算机工程与设计》更多>>
相关主题:语音识别稳健性说话人自适应自适应方法信息处理更多>>
相关领域:自动化与计算机技术电子电信更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
集成语种辨识的中英文LVCSR系统
《计算机工程与设计》2007年第8期1931-1933,共3页孙健 王作英 
国家863高技术研究发展计划基金项目(2001AA114071)
为了在未知一段语音所属语言种类的情况下将其转换为正确的字符序列,将语种辨识(language identification,LID)同语音识别集成在一起建立了中、英文大词汇量连续语音识别(large vocabulary continuous speech recognition,LVCSR)系统。...
关键词:连续语音识别 语种辨识 段长分布 非齐次隐含马尔科夫模型 语种剪枝 
利用隐空间投影算法的模型自适应方法
《清华大学学报(自然科学版)》2007年第7期1159-1161,共3页王晶莹 王作英 
国家"八六三"高技术项目(2001AA114071)
为了降低语音识别系统中噪声的影响,提出一种利用隐空间投影算法的模型自适应方法。该方法利用状态间的相关性提取出反映码本和待识别语音共同特性的基矢量。由于语音与噪声是相互独立的,因此,当语音识别系统中有噪声存在时,认为不...
关键词:信息处理 说话人自适应 隐空间投影 空间相关性 
一种利用主曲线的说话人自适应方法
《高技术通讯》2007年第5期470-473,共4页王晶莹 王作英 
863计划(2001AA114071)资助项目.
为了克服噪声对语音识别系统的影响,提出了一种基于主曲线的说话人自适应方法,这种方法可以通过一组主曲线描述所有状态的特征统计信息和码本参数之间的关系,并利用特征统计量在主曲线上的投影更新码本。当有背景噪声存在时,这种方法可...
关键词:主曲线 说话人自适应 相关性 空间相关性 
一种基于词序信息的自动文摘方法被引量:3
《计算机工程与设计》2007年第1期178-181,共4页任纪生 张弛 王作英 
国家863高技术研究发展计划基金项目(2001AA114071)
自动文摘技术应尽可能获取准确的相似度以确定句子或段落的权重,但目前常用的基于向量空间模型的计算方法却忽视句子、段落、文本中词的顺序。提出了一种新的基于相邻词序组的相似度度量方法并应用于文本的自动,采用基于聚类的方法实现...
关键词:自动文摘 词序 向量空间模型 相似度 权重 
实用环境语音识别鲁棒性技术研究与展望被引量:1
《计算机工程与应用》2006年第24期7-12,共6页刘敬伟 肖熙 
国家863高技术研究发展计划资助项目(编号:2001AA114071);中国博士后科学基金;清华大学博士后基金;北京航空航天大学"985二期""复杂系统与空间物质结构科技创新平台"项目资助
语音识别系统在实用环境中的鲁棒性是语音识别技术实用化的关键问题。鲁棒性研究的核心问题是如何解决实用环境语音特征和模型与干净环境语音识别系统的失配问题,这涉及到噪声补偿、信道适应、说话人自适应等关键技术。文章综述了语音...
关键词:语音识别 实用环境 稳健性 信道适应 说话人自适应 
基于DDBHMM的LVCSR系统的单步搜索算法
《清华大学学报(自然科学版)》2006年第10期1735-1738,共4页孙健 王作英 
国家"八六三"高技术项目(2001AA114071)
为了在大词汇量连续语音识别(LVCSR)系统中能够利用段长信息,该文按树状组织发音词典,利用语言模型预测技术,基于最大似然状态序列(M LSS)算法,给出了采用基于段长分布的隐含M arkov模型(DDBHMM)的LVCSR系统的二元文法语言模型的单步搜...
关键词:大词汇量连续语音识别 单步搜索 段长分布 最大似然状态序列 
语音识别中信道和噪音的联合补偿被引量:11
《声学学报》2006年第5期466-470,共5页赵蕤 王作英 
863计划项目(2001AA114071)
频谱和倒谱的联合调整方法,用于对语音识别中信道差异和背景噪音的存在进行联合补偿。该方法根据干净语音的最大似然准则在频域和倒谱域分别对噪音和信道进行补偿,避免了对噪音和信道影响模型进行简化所带来的误差影响,且实现时间复杂...
关键词:背景噪音 语音识别 信道 补偿 最大似然准则 时间复杂度 汉语数字串 误差影响 
融合段长信息的中、英文语种辨识
《模式识别与人工智能》2006年第5期567-571,共5页孙健 王作英 
国家863计划资助项目(No.2001AA114071)
状态的段长信息反映语言发音变化速率的信息.不同语言的发音速率也存在着差异,因此状态的段长信息可以作为区分语种的信息之一.本文在建立基于段长分布的隐含 Markov 模型(DDBHMM)的音素识别系统和大词汇量连续语音识别(LVCSR)系统的基...
关键词:语种辨识 基于段长分布的隐含Markov模型(DDBHMM) Gauss混合模型 连续音素识别 大词汇量连续语音识别(LVCSR) 
基于特征有序对量化表示的文本分类方法被引量:4
《清华大学学报(自然科学版)》2006年第4期527-529,533,共4页任纪生 王作英 
国家"八六三"高技术项目(2001AA114071)
文本分类技术应尽可能包含语言中各种各样的约束信息,但目前常用的文本表示方法却忽视组成文本的语言特征顺序。该文采用基于聚类的方法实现语言特征有序对的快速量化表示,并由此导出新的基于特征有序对的文本表示方法以揭示文本中所...
关键词:文本分类 特征选择 特征抽象 特征变换 奇异值分解 
一种新的基于主题的语言模型自适应方法被引量:3
《中文信息学报》2006年第4期82-87,共6页任纪生 王作英 
国家863计划资助项目(2001AA114071)
基于主题的语言模型自适应方法应尽可能提高语言模型权重系数的更新速度并降低语言模型的调用量以满足语音识别实时性要求。本文采用基于聚类的方法实现连续相邻二元词对的量化表示并以此刻画语音识别预测历史和各个文本主题中心,依据...
关键词:计算机应用 中文信息处理 语言模型 主题自适应 语音识别 文本分类 
检索报告 对象比较 聚类工具 使用帮助 返回顶部