蔡猛

作品数:5被引量:28H指数:3
导出分析报告
供职机构:清华大学电子工程系更多>>
发文主题:BOTTLENECK说话人识别DNN说话人识别系统神经网络更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《中国科学院大学学报(中英文)》《清华大学学报(自然科学版)》《天津大学学报(自然科学与工程技术版)》《计算机应用》更多>>
所获基金:国家自然科学基金北京市自然科学基金国家高技术研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-5
视图:
排序:
基于深度神经网络和Bottleneck特征的说话人识别系统被引量:13
《清华大学学报(自然科学版)》2016年第11期1143-1148,共6页田垚 蔡猛 何亮 刘加 
国家自然科学基金资助项目(61273268,61370034,61403224)
近来,一种结合语音识别中深度神经网络(deep neural network,DNN)模型和说话人识别中身份认证矢量(identity vector,i-vector)模型的方法被证明对说话人识别十分有效。为了进一步提升系统性能,该文提出使用基于说话人标签的DNN模型...
关键词:说话人识别 深度神经网络 Bottleneck特征 
基于音素后验概率的样例语音关键词检测方法被引量:3
《天津大学学报(自然科学与工程技术版)》2015年第9期757-760,共4页张卫强 宋贝利 蔡猛 刘加 
国家自然科学基金资助项目(61370034;61273268;61403224)
低资源条件下的语音关键词检测是一个具有挑战性的问题,因为传统的基于大词汇量连续语音识别(LVCSR)的语音关键词检测方法不再适用.针对此问题提出了一种基于深度神经网络(DNN)输出层后验概率特征和改进的动态时间规整(DTW)算法的语音...
关键词:样例查询 语音关键词检测 DNN输出层特征 动态时间规整 
低数据资源条件下基于Bottleneck特征与SGMM模型的语音识别系统被引量:9
《中国科学院大学学报(中英文)》2015年第1期97-102,共6页吴蔚澜 蔡猛 田垚 杨晓昊 陈振锋 刘加 夏善红 
国家自然科学基金(61005019;61273268;61370034;90920302);北京市自然科学基金(KZ201110005005)资助
语音识别系统需要大量有标注训练数据,在低数据资源条件下的识别性能往往不理想.针对数据匮乏问题,本文先研究子空间高斯混合声学模型通过参数共享减少待估计的参数规模,并使用基于最大互信息准则的区分型训练技术提高识别精度;而后在...
关键词:语音识别 低资源 声学模型 声学特征 
发音错误检测中基于多数据流的Tandem特征方法被引量:1
《计算机应用》2014年第6期1694-1698,共5页袁桦 蔡猛 赵军红 张卫强 刘加 
国家自然科学基金资助项目(61370034;61273268;61005019;61105017)
针对发音错误检测中标注的发音数据资源有限的情况,提出在Tandem系统框架下利用其他数据来提高特征的区分性。以中国人的英语发音为研究对象,选取了相对容易获取的无校正发音数据、母语普通话和母语英语作为辅助数据,实验结果表明,这几...
关键词:发音错误检测 Tandem特征 发音规则 深度神经网络(DNN) 多层神经感知(MLP) 
集合分类中的鉴别式局部信息距离保持映射被引量:2
《清华大学学报(自然科学版)》2011年第7期1010-1016,共7页何亮 栗志意 蔡猛 刘加 
国家自然科学基金资助项目(90920302;61005019);国家"八六三"高技术项目(2008AA040201)
该文提出鉴别式局部信息距离保持映射,以解决一类集合分类问题。鉴别式局部信息距离保持映射假设集合所对应的概率密度分布位于统计流形上,选取Fisher信息距离作为概率密度分布间的距离,并将最小化同类点的信息距离、最大化异类近邻点...
关键词:集合分类 流形学习 信息距离 局部保持映射 说话人识别 无用分量投影 
检索报告 对象比较 聚类工具 使用帮助 返回顶部