国家自然科学基金(60931160443)

作品数:13被引量:36H指数:4
导出分析报告
相关作者:刘加宋辉单煜翔杨毅邓妍更多>>
相关机构:清华大学中国科学院电子学研究所更多>>
相关期刊:《电子与信息学报》《计算机工程》《自动化学报》《Tsinghua Science and Technology》更多>>
相关主题:语音识别语种识别麦克风阵列噪声消除外语更多>>
相关领域:电子电信自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
低数据资源条件下基于优化的数据选择策略的无监督语音识别声学建模被引量:2
《清华大学学报(自然科学版)》2013年第7期1001-1004,1010,共5页钱彦旻 刘加 
国家自然科学基金资助项目(60931160443,61273268,90920302);国家科技支撑计划项目(2009BAH41B01)
为了克服低数据资源条件下的资源匮乏问题,该文利用无监督的声学模型训练方法来增加训练数据,改善系统性能。在标准的无监督训练框架下,在传统词图后验概率的词置信度基础上,提出了基于句子后验概率的置信度数据筛选准则,所选数据在保...
关键词:语音识别 低数据资源 无监督训练 数据选择 
基于HCSIPA的中英文混合语音合成被引量:4
《计算机工程》2013年第4期14-17,共4页徐英进 蔡莲红 
国家自然科学基金资助项目(60928005,60931160443)
基于双语说话人的中英文混合合成,提出一种中英文通用音标符号——HCSIPA,采用发音方式和部位为构造标准。在中英文混合聚类中,构造针对HCSIPA的中英文共用问题集,以提高中英文在决策树结构上的区分度。实验结果表明,HCSIPA能提高中文...
关键词:HMM混合语音合成 音标符号 HCSIPA符号 双语说话人 音色统一 
大规模词表连续语音识别引擎紧致动态网络的构建被引量:1
《清华大学学报(自然科学版)》2012年第11期1530-1534,共5页刘加 陈谐 单煜翔 史永哲 
国家自然科学基金委员会与香港研究资助局联合科研基金资助项目(60931160443);国家自然科学基金项目(90920302;61005019);国家"八六三"高技术项目(2008AA040201);国家科技支撑计划资助项目(2009BAH41B01)
大规模词表连续语音识别系统需要综合各种知识源,如声学模型、语言模型、发音词典等。其中,解码网络是识别引擎的基础,对提高解码器的性能有着至关重要的影响。有效综合这些知识源,构建一个紧致的解码网络,可以有效减少识别时的搜索空...
关键词:语音识别 解码网络 声学模型 语言模型预测 
基于扩展N元文法模型的快速语言模型预测算法被引量:6
《自动化学报》2012年第10期1618-1626,共9页单煜翔 陈谐 史永哲 刘加 
国家高技术研究发展计划(863计划)(2008AA040201);国家自然科学基金(90920302);国家科技支撑计划(2009BAH41B01);国家自然科学基金委员会与香港研究资助局联合科研基金(60931160443)资助~~
针对基于动态解码网络的大词汇量连续语音识别器,本文提出了一种采用扩展N元文法模型进行快速语言模型(Language model,LM)预测的方法.扩展N元文法模型统一了语言模型和语言模型预测树的表示与分数计算方法,从而大大简化了解码器的实现...
关键词:语音识别 语言模型预测 N元文法模型 解码 
基于优化检测网络和MLP特征改进发音错误检测的方法被引量:2
《清华大学学报(自然科学版)》2012年第4期557-560,570,共5页袁桦 钱彦旻 赵军红 刘加 
国家自然科学基金资助项目(60931160443,90920302,N-CUHK414/09);国家科技支撑计划项目(2009BAH41B01)
该文基于优化的检测网络和多层感知(multi-layerperception,MLP)特征,提出一种可以更加准确地检测出错误发音类型的方法。首先,从第二语言学习的语音库中提取出基本的发音规则以及组合的发音规则,并相应地计算它们发生的先验概率,再将...
关键词:发音错误检测 发音规则 多层感知(MLP) 发音特征 
一种联合语种识别的新型大词汇量连续语音识别算法被引量:10
《自动化学报》2012年第3期366-374,共9页单煜翔 邓妍 刘加 
高技术研究发展计划(国家863计划)(2008AA02Z414;2008AA040201);国家自然科学基金(60776800;61005019);国家自然科学基金委员会与香港研究资助局联合科研基金(60931160443)资助~~
提出了一种联合语种识别的新型大词汇量连续语音识别(Large vocabulary continuo us speech recognition,LVCSR)算法,并构建了实时处理系统.该算法能够充分利用语音解码过程中收集的音素识别假设,在识别语音内容的同时识别语种类别.该...
关键词:语音识别 语种识别 集外语种问题 音素格重构 
基于多路线性预测技术的时延估计被引量:2
《清华大学学报(自然科学版)》2011年第11期1756-1760,共5页宋辉 杨毅 刘加 
国家自然科学基金委员会与微软亚洲研究院联合资助项目(60776800);国家自然科学基金委员会与香港研究资助局联合科研基金资助项目(60931160443);国家“八六三”高技术发展项目(2008AA02Z414,2008AA040201)
很多麦克风阵列时延估计算法在噪声和混响环境下性能都会下降。该文提出一种基于多路线性预测(multi-ple linear prediction,MLP)的时延估计算法。通过传递函数比估计来消除通道间传递函数的非对称性,提高信号相关程度;空间预测技术引...
关键词:麦克风阵列 时延估计 线性预测 空间预测 
基于MLER和GMM的语音音乐分类被引量:2
《电声技术》2011年第10期47-50,共4页陈红红 刘加 
国家自然科学基金委员会与香港研究资助局联合科研基金资助项目(60931160443);国家自然科学基金项目(90920302;61005019);国家高技术研究发展计划(863计划)项目(2008AA040201)
研究了音频信息处理中一项重要的预处理工作:语音音乐分类。针对语音信号处理中遇到的实际问题,选择合适的音频特征和分类器来对音频数据进行语音和音乐分类。采用二级系统,选择优化低能量率(ModifiedLow Energy Ratio,MLER)以及梅尔频...
关键词:二级系统 优化低能量率 梅尔频谱倒谱系数 混合高斯分类器 上下文分类器 
数字摄像机自动聚焦机械噪声消除方法研究
《电视技术》2011年第9期86-89,共4页杨毅 宋辉 刘加 
国家自然科学基金委员会与微软亚洲研究院联合资助项目(60776800);国家自然科学基金委员会与香港研究资助局联合科研基金资助项目(60931160443);国家高技术研究发展计划(863计划)项目(2008AA040201;2008AA02Z414);国家自然科学基金项目(90920302)
数字摄像机的摄像头在缩放时产生较大声噪,回放时主观听觉十分明显,因此需要研究一种高质量语音降噪算法,用于消除机械声噪,同时避免产生语音畸变。通过分析传声器阵列及带噪声源的数学模型,构建了一套基于传声器阵列的语音降噪系统,针...
关键词:语音信号处理 数字摄像机 机械噪声 噪声消除 传声器阵列 
基于广义奇异值分解的通用旁瓣消除算法被引量:6
《数据采集与处理》2011年第3期241-246,共6页宋辉 刘加 
国家自然科学基金委员会与微软亚洲研究院联合基金(60776800)资助项目;国家高技术研究发展计划("八六三"计划)(2006AA010101;2008AA040201)资助项目;国家自然科学基金委员会与香港研究资助局联合科研基金(60931160443)资助项目
提出一种新的通用旁瓣消除器结构,它利用广义奇异值分解(Generalized singular value decomposition,GSVD)技术,通过广义奇异向量的变换间接估计声源到麦克风之间的传递函数。不同噪声环境下的实验结果表明,与现有的各种GSC算法相比,该...
关键词:麦克风阵列 语音增强 噪声消除 通用旁瓣消除 广义奇异值分解 
检索报告 对象比较 聚类工具 使用帮助 返回顶部