潘接林

作品数:29被引量:163H指数:5
导出分析报告
供职机构:中国科学院声学研究所更多>>
发文主题:语音识别语音识别系统声学模型语音特征矢量更多>>
发文领域:电子电信自动化与计算机技术语言文字理学更多>>
发文期刊:《电子与信息学报》《自动化学报》《工程科学学报》《声学学报》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划中国科学院战略性先导科技专项国家重点基础研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
迭代数控制的稀疏约束波束形成算法
《网络新媒体技术》2018年第5期25-30,共6页曹占中 胡冬妮 李煦 潘接林 颜永红 
国家自然科学基金(批准号:11461141004;61271426;U1536117;11504406;11590770-4);中国科学院战略性先导科技专项(面向感知中国的新一代信息技术研究;编号:XDA06030100;XDA06030500;XDA06040603);国家863计划(编号:2015AA016306);国家973计划(编号:2013CB329302);新疆维吾尔自治区科技重大专项(编号:201230118-3)经费资助
研究了基于L1范数约束的快速迭代算法,分析了其迭代过程以及与波束形成算法相结合的方式。提出了一种基于迭代数控制的波束形成算法,并给出了实现过程。所提算法避免了现有算法对信噪比估计的依赖,并提高了算法在低信噪比环境下的干扰...
关键词:波束形成 稀疏约束 自适应滤波 阵列信号处理 
迭代数控制的稀疏约束波束形成算法被引量:2
《网络新媒体技术》2017年第6期48-53,共6页曹占中 胡冬妮 李煦 潘接林 颜永红 
国家自然科学基金(批准号:11461141004;61271426;U1536117;11504406;11590770-4);中国科学院战略性先导科技专项(面向感知中国的新一代信息技术研究;编号:XDA06030100;XDA06030500;XDA06040603);国家863计划(编号:2015AA016306);国家973计划(编号:2013CB329302);新疆维吾尔自治区科技重大专项(编号:201230118-3)经费资助
研究了基于L1范数约束的快速迭代算法,分析了其迭代过程以及与波束形成算法相结合的方式。提出了一种基于迭代数控制的波束形成算法,并给出了实现过程。所提算法避免了现有算法对信噪比估计的依赖,并提高了算法在低信噪比环境下的干扰...
关键词:波束形成 稀疏约束 自适应滤波 阵列信号处理 
传声器阵列波束比判决语音增强方法
《声学学报》2017年第4期504-512,共9页曹占中 纳跃跃 王晓飞 付强 潘接林 颜永红 
国家自然科学基金项目(11461141004;61271426;11504406;11590770;11590771;11590772;11590773;11590774);中国科学院战略性先导科技专项项目(面向感知中国的新一代信息技术研究:XDA06030100;XDA06030500;XDA06040603);国家863计划(2015AA016306);国家973计划项目(2013CB329302);新疆维吾尔自治区科技重大专项项目(201230118-3)资助
针对单一波束形成器难以深度抑制空间相干干扰的问题,提出了一种综合了最小方差无畸变响应波束形成器与对称子阵延时求和波束形成器的语音增强方法。定义了一种波束输出比因子,根据该因子在目标声区域和干扰声区域的幅值变化,给出了采...
关键词:波束形成器 语音增强 传声器阵列 协方差矩阵 语音质量 重构算法 圆阵 信干噪比 算法处理 最小方差 
基于SVD的DNN裁剪方法和重训练被引量:3
《清华大学学报(自然科学版)》2016年第7期772-776,共5页邢安昊 张鹏远 潘接林 颜永红 
国家自然科学基金资助项目(11461141004,91120001,61271426);国家“八六三”高技术项目(2012AA012503);中国科学院战略性先导科技专项(XDA06030100,XDA06030500);中国科学院重点部署项目(KGZD-EW-103-2)
深层神经网络(DNN)的参数量巨大,限制了其在一些计算资源受限或是注重速度的应用场景中的应用。为了降低DNN参数量,有学者提出利用奇异值分解(SVD)对DNN进行裁剪,然而其方法缺乏自适应性,因为它会从所有隐层裁减掉同样数量的奇异值。该...
关键词:语音识别 深层神经网络(DNN) 奇异值分解(SVD) 
语音识别中深度神经网络目标值优化被引量:4
《四川大学学报(工程科学版)》2016年第1期166-172,共7页陈梦喆 张晴晴 潘接林 颜永红 
国家自然科学基金资助项目(11161140319;91120001;61271426);中国科学院战略性先导科技专项项目(XDA06030100;XDA06030500);国家"863"计划资助项目(2012AA012503);中科院重点部署项目资助(KGZD-EW-103-2)
训练深度神经网络声学模型时,所采用的强制对齐得到的目标值存在无法精准地表示出语音实际状况的问题。针对这一问题,提出一种利用前后向算法得到非0-1分布目标值的方法。由于用于强制对齐的模型可能与处理语句不完全匹配,以及发音连续...
关键词:语音识别 深度神经网络 前后向算法 目标值优化 
基于卷积神经网络的连续语音识别被引量:72
《工程科学学报》2015年第9期1212-1217,共6页张晴晴 刘勇 潘接林 颜永红 
国家自然科学基金资助项目(11161140319;91120001;61271426);中国科学院战略性先导科技专项(XDA06030100;XDA06030500);国家高技术研究发展计划资助项目(2012AA012503);中国科学院重点部署项目(KGZD-EW-103-2)
在语音识别中,卷积神经网络(convolutional neural networks,CNNs)相比于目前广泛使用的深层神经网络(deep neural network,DNNs),能在保证性能的同时,大大压缩模型的尺寸.本文深入分析了卷积神经网络中卷积层和聚合层的不同结构对识别...
关键词:卷积神经网络 连续语音识别 权值共享 聚合 泛化性 
卷积神经网络在语音识别中的应用被引量:15
《网络新媒体技术》2014年第6期39-42,共4页张晴晴 刘勇 王智超 潘接林 颜永红 
国家自然科学基金(编号:11161140319;91120001;61271426);中国科学院战略性先导科技专项(面向感知中国的新一代信息技术研究;编号:XDA06030100;XDA06030500);国家863计划(编号:2012AA012503);中科院重点部署项目(编号:KGZD-EW-103-2)基金资助
研究了使用卷积神经网络构造模式分类器,并用于连续语音识别的研究。CNNs相比于广泛使用于语音识别中的深层神经网络(Deep Neural Network,DNNs),能在保证性能的同时,大大压缩模型的尺寸。在标准语音识别库TIMIT上的实验结果证明,相比传...
关键词:卷积神经网络 连续语音识别 权值共享 
面向口语统计语言模型建模的自动语料生成算法被引量:1
《自动化学报》2014年第12期2808-2814,共7页司玉景 肖业鸣 徐及 潘接林 颜永红 
国家高技术研究发展计划(863计划)(2012AA012503);国家自然科学基金(10925419;90920302;61072124;11074275;11161140319;91120001;61271426);中国科学院战略性先导利技专项(XDA06030100;XDA06030500);中国利学院重点部岩项日(KGZD-EW-103-2)资助~~
在资源相对匮乏的自动语音识别(Automatic speech recognition,ASR)领域,如面向电话交谈的语音识别系统中,统计语言模型(Language model,LM)存在着严重的数据稀疏问题,本文提出了一种基于等概率事件的采样语料生成算法,白动生成领域相...
关键词:自动语音识别 资源匮乏 语言模型 等概率事件 语料生成算法 
汉语语言集外词检索算法的改进研究
《网络新媒体技术》2014年第4期30-32,共3页王旭阳 张鹏远 潘接林 颜永红 
国家自然科学基金(批准号:11161140319;91120001;61271426);中国科学院战略性先导科技专项(面向感知中国的新一代信息技术研究;编号:XDA06030100;XDA06030500);国家863计划(资助号:2012AA012503);中科院重点部署项目(编号:KGZD-EW-103-2)经费资助
针对汉语语音关键词检索任务中的集外词检索提出了一种基于局部声学信息的改进算法。在汉语语音识别和语音关键词检索任务中,由于集外词可以由词典内部的字词组合而成,因而通常认为不存在类似英文等语言中的集外词检索的问题。然而,由...
关键词:检索 集外词 令牌传递 置信度重估 
基于隐藏单元条件随机场的多知识源融合改进自动语音识别置信度被引量:1
《电子与信息学报》2014年第8期1852-1858,共7页高兴龙 潘接林 颜永红 
国家自然科学基金(10925419;90920302;61072124;11074275;11161140319;91120001;61271426);中国科学院战略性先导科技专项(XDA06030100;XDA06030500);国家863计划项目(2012AA012503);中科院重点部署项目(KGZD-EW-103-2)资助课题
鉴于自动语音识别(ASR)中置信度估计困难的问题,该文提出一种基于多知识源融合的策略来提高置信度的鉴别能力。具体做法是,首先选择关于识别结果的声学层、语言层和语义层等不同层次的信息,然后通过实验确定这些信息不同的组合方式,并...
关键词:语音识别 置信度估计 多知识源融合 隐藏单元条件随机场 网格重估 
检索报告 对象比较 聚类工具 使用帮助 返回顶部