国家高技术研究发展计划(2012AA012503)

作品数:49被引量:214H指数:6
导出分析报告
相关作者:颜永红潘接林周若华张晴晴李军锋更多>>
相关机构:中国科学院北京理工大学江西理工大学国家互联网应急中心更多>>
相关期刊:《声学技术》《清华大学学报(自然科学版)》《Journal of Beijing Institute of Technology》《山东大学学报(理学版)》更多>>
相关主题:语音识别神经网络语音DNN语种识别更多>>
相关领域:电子电信自动化与计算机技术理学医药卫生更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
应用于语种识别的加权音素对数似然比特征被引量:4
《清华大学学报(自然科学版)》2017年第10期1038-1041,1047,共5页张健 徐杰 包秀国 周若华 颜永红 
国家自然科学基金资助项目(11461141004;91120001;61271426);国家"八六三"高技术项目(2012AA012503);中国科学院战略性先导科技专项(XDA06030100;XDA06030500);中科院重点部署项目(KGZD-EW-103-2)
语种识别的关键问题之一是提取语音信号中的语种鉴别性信息。近期,音素对数似然比(phone log-likelihood ratio,PLLR)的新特征被引入语种识别领域,并表现出了优异的性能。该文利用F比方法分析了PLLR特征向量各维的语种鉴别性大小,提出...
关键词:语音信号处理 语种识别 语种鉴别性 加权音素对数似然比(WPLLR) F比 
PLF Optimization for Target Language Detection
《Chinese Journal of Electronics》2017年第1期118-121,共4页ZHANG Jian YUAN Qingsheng BAO Xiuguo ZHOU Ruohua YAN Yonghong 
supported by the National Natural Science Foundation of China(No.11161140319,No.91120001,No.61271426);the Strategic Priority Research Program of the Chinese Academy of Sciences(No.XDA06030100,No.XDA06030500);the National High Technology Research and Development Program of China(No.2012AA012503);the Chinese Academy of Sciences Priority Deployment Project(No.KGZD-EW-103-2)
The objective of traditional feature studies in Spoken language recognition(SLR) is extracting the linguistic discrimination between each language. However,applications of security area always interested in a particul...
关键词:Spoken language recognition Target language detection Weighted phone log-posteriors F-Ratio 
基于NMF和FCRF的单通道语音分离被引量:1
《清华大学学报(自然科学版)》2017年第1期84-88,共5页李煦 屠明 吴超 国雁萌 纳跃跃 付强 颜永红 
国家自然科学基金资助项目(11461141004,91120001,61271426);中国科学院战略性先导科技专项(XDA06030100,XDA06030500);国家“八六三”高技术项目(2012AA012503);中科院重点部署项目(KGZD-EW-103-2)
近年来,非负矩阵分解(non-negative matrix factorization,NMF)被广泛应用于单通道语音分离问题。然而,标准的NMF算法假设语音的相邻帧之间是相互独立的,不能表征语音信号的时间连续性信息。为此,该文提出了一种基于NMF和因子条件随机场...
关键词:单通道语音分离 因子条件随机场 非负矩阵分解 K均值聚类 
A General Bayesian Model for Speaker Verification被引量:1
《Chinese Journal of Electronics》2016年第6期1045-1051,共7页XU Yunfei YANG Hai YANG Lin ZHOU Ruohua YAN Yonghong 
supported by the National Natural Science Foundation of China(No.11161140319,No.91120001,No.61271426);the Strategic Priority Research Program of the Chinese Academy of Sciences(No.XDA06030100,No.XDA06030500);the National 863 Program(No.2012AA012503);the CAS Priority Deployment Project(No.KGZD-EW-103-2)
This paper presents a general Bayesian model for speaker verification tasks. It is a generative probability model. Due to its simple analytical property, a computationally efficient expectation-maximization algorithm ...
关键词:Bayesian model Speaker verification I-Vector 
基于SVD的DNN裁剪方法和重训练被引量:3
《清华大学学报(自然科学版)》2016年第7期772-776,共5页邢安昊 张鹏远 潘接林 颜永红 
国家自然科学基金资助项目(11461141004,91120001,61271426);国家“八六三”高技术项目(2012AA012503);中国科学院战略性先导科技专项(XDA06030100,XDA06030500);中国科学院重点部署项目(KGZD-EW-103-2)
深层神经网络(DNN)的参数量巨大,限制了其在一些计算资源受限或是注重速度的应用场景中的应用。为了降低DNN参数量,有学者提出利用奇异值分解(SVD)对DNN进行裁剪,然而其方法缺乏自适应性,因为它会从所有隐层裁减掉同样数量的奇异值。该...
关键词:语音识别 深层神经网络(DNN) 奇异值分解(SVD) 
电话交谈语音识别中基于LSTM-DNN语言模型的重评估方法研究被引量:8
《重庆邮电大学学报(自然科学版)》2016年第2期180-186,193,共8页左玲云 张晴晴 黎塔 梁宏 颜永红 
国家自然科学基金(10925419;90920302;61072124;11074275;11161140319;91120001;61271426);中国科学院战略性先导科技专项(XDA06030100;XDA06030500);国家863计划(2012AA012503);中科院重点部署项目(KGZD-EW-103-2)~~
近年来,神经网络语言模型的研究越来越受到学术界的广泛关注。基于长短期记忆(long short-term memory,LSTM)结构的深度神经网络(LSTM-deep neural network,LSTM-DNN)语言模型成为当前的研究热点。在电话交谈语音识别系统中,语料本身具...
关键词:长短期记忆 神经网络语言模型 语音识别 重评估 
语音识别中深度神经网络目标值优化被引量:4
《四川大学学报(工程科学版)》2016年第1期166-172,共7页陈梦喆 张晴晴 潘接林 颜永红 
国家自然科学基金资助项目(11161140319;91120001;61271426);中国科学院战略性先导科技专项项目(XDA06030100;XDA06030500);国家"863"计划资助项目(2012AA012503);中科院重点部署项目资助(KGZD-EW-103-2)
训练深度神经网络声学模型时,所采用的强制对齐得到的目标值存在无法精准地表示出语音实际状况的问题。针对这一问题,提出一种利用前后向算法得到非0-1分布目标值的方法。由于用于强制对齐的模型可能与处理语句不完全匹配,以及发音连续...
关键词:语音识别 深度神经网络 前后向算法 目标值优化 
基于功率谱包络动态分割的鲁棒语音端点检测被引量:1
《北京理工大学学报》2015年第11期1189-1193,共5页许春冬 王晶 战鸽 应冬文 李军锋 颜永红 
国家重点基础研究发展计划项目资助(2013CB32930);国家自然科学基金资助项目(61271426;10925419;90920302;61072124;11074275;11161140319;91120001);中国科学院战略性先导科技专项基金资助项目(XDA06030100;XDA06030500);国家"八六三"计划项目(2012AA012503);中科院重点部署资助项目(KGZD-EW-103-2);江西理工大学科研基金资助项目(NSFJ2015-G21)
在复杂的声学环境中,由于环境噪声的干扰,导致声学特征的稳定性不够理想.为克服此难题,通常对决策结果在时间维度上进行平滑.然而,这些平滑过程本身没有考虑数据在时间维度上的结构特征,属于启发式的方法.该文采用动态分割的方法,将语...
关键词:语音端点检测 动态分割 聚类 最小描述长度准则 
具有选择注意能力的语音拾取技术被引量:4
《中国科学:信息科学》2015年第10期1310-1327,共18页王晓飞 国雁萌 葛凤培 吴超 付强 颜永红 
国家自然科学基金项目(批准号:11161140319);中国科学院战略性先导科技专项(批准号:XDA06030100;XDA06030500);国家高技术研究发展计划(863计划)项目(批准号:2012AA012503);中国科学院重点部署项目(批准号:KGZD-EW-103-2)资助
随着语音通信和人机语音交互系统的不断普及,人们越来越期待抛开话筒和耳机等繁琐的设备,实现像人类对话一般自然的人机语音交流.然而,语音毕竟只是一种声波,在空气中传输时难免受到各种影响,例如声波的衰减、墙壁和障碍物的多次反射以...
关键词:传声器阵列 唤醒词 声学回波控制 语音增强 目标语音检测 混响抑制 
基于DNN的声学模型自适应实验被引量:5
《天津大学学报(自然科学与工程技术版)》2015年第9期765-770,共6页张宇 计哲 万辛 张震 葛凤培 颜永红 
国家高技术研究发展计划(863计划)资助项目(2012AA012503);中国科学院战略性先导科技专项(XDA06030100,XDA 06030500);国家自然科学基金资助项目(11461141004,91120001,61271426);中科院重点部署资助项目(KYGD-EW-103-2)
声学模型自适应算法研究目的是缓解由测试数据和训练数据不匹配而引起的识别性能下降问题.基于深度神经网络(DNN)模型框架的自适应技术中,重训练是最直接的方法,但极容易出现过拟合现象,尤其是自适应数据稀疏的情况下.文章针对领域相关...
关键词:声学模型自适应 语音识别 深度神经网络 
检索报告 对象比较 聚类工具 使用帮助 返回顶部