国家自然科学基金(91120303)

作品数:15被引量:45H指数:4
导出分析报告
相关作者:韩纪庆郑铁然刘文举郑贵滨李鹏更多>>
相关机构:哈尔滨工业大学中国科学院自动化研究所三明学院河南理工大学更多>>
相关期刊:《智能计算机与应用》《Chinese Journal of Acoustics》《Chinese Journal of Electronics》《电子与信息学报》更多>>
相关主题:BASEDMUSIC说话人识别LARGE声学模型更多>>
相关领域:自动化与计算机技术电子电信交通运输工程机械工程更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于快速近似时序池化的端到端声学事件识别
《智能计算机与应用》2020年第12期1-5,11,共6页张力文 韩纪庆 
国家重点研发项目(2017YFB1002102);国家自然科学基金(91120303)。
声学事件识别系统的性能很大程度上取决于音频特征学习的有效性。由于音频信号属于时序性信号,要获得有效的音频特征,就需要提取其中的时序信息。作者曾提出了一种有效的时序性特征学习方法:时序池化。然而,由于其需要求解一个没有闭式...
关键词:声学事件识别 音频特征学习 时序池化 卷积神经网络 
Partial Least Squares Based Total Variability Space Modeling for I-Vector Speaker Verification被引量:4
《Chinese Journal of Electronics》2018年第6期1229-1233,共5页CHEN Chen HAN Jiqing 
supported by the National Natural Science Foundation of China(No.61471145,No.91120303)
As an effective and low-dimension representation for speech utterances with different lengths,i-vector method has drawn considerable attentions in speaker verification. Training a Total variability space(TVS) is one o...
关键词:Speaker verification I-vector Total variability space Partial least squares 
Sparse Representation Based Image Super-resolution Using Large Patches被引量:1
《Chinese Journal of Electronics》2018年第4期813-820,共8页LIU Ning ZHOU Pan LIU Wenju KE Dengfeng 
supported by the National Natural Science Foundation of China(No.61573357,No.61503382,No.61403370,No.61273267,No.91120303)
This paper addresses the problem of generating a high-resolution image from a low-resolution image. Many dictionary based methods have been proposed and have achieved great success in super resolution application. Mos...
关键词:Super resolution Sparse representations Binary encoding 
基于深度学习的环境声音识别被引量:9
《智能计算机与应用》2018年第5期34-37,41,共5页史秋莹 郑铁然 
国家自然科学基金(91120303)
作为一种感知周围环境十分有效的方法,环境声音识别(Environment Sound Recognition,ESR)被广泛地应用在机器人导航、移动机器人、音频检索、音频取证以及其它基于情景感知、可穿戴的应用中。目前,较为简单的分类器已经大规模应用在ESR...
关键词:环境声音识别 特征融合 深度学习 
基于Fisher判别字典学习的说话人识别被引量:6
《电子与信息学报》2016年第2期367-372,共6页王伟 韩纪庆 郑铁然 郑贵滨 陶耀 
国家自然科学基金(61071181;61471145);国家自然科学基金重大研究计划(91120303)~~
稀疏表示已成功应用于说话人识别领域。在稀疏表示中,构造好的字典起着重要的作用。该文将Fisher准则的结构化字典学习方法引入说话人识别系统。在判别字典的学习过程中,每一个字典对应一个类标签,因此同类别训练样本的重构误差较小。同...
关键词:说话人识别 字典学习 稀疏表示 FISHER判别 
基于非均匀MCE准则的DNN关键词检测系统中声学模型的训练被引量:1
《智能计算机与应用》2015年第5期15-17,21,共4页王朝松 韩纪庆 郑铁然 
国家自然科学基金(91120303)
关键词检测是从连续语音流中检测预先定义的给定词的技术,是语音识别领域的一个重要应用。目前的关键词检测研究中,主流的方法是基于连续语音识别器的先识别后检测的两阶段方法,语音识别器的准确率对关键词检测有很大影响。本文首先在...
关键词:深度学习 关键词检测 ADA BOOST 最小分类错误 
说话人识别方法综述被引量:3
《智能计算机与应用》2015年第5期92-94,97,共4页陈晨 韩纪庆 
国家自然科学基金(91120303)
作为语音处理领域的主要技术之一,说话人识别以确认说话人身份为目标,在移动交互、身份验证、音频监控等领域有着广泛的应用前景。经过数十年的发展,说话人识别技术已经能够取得优秀的识别性能。本文将对说话人识别方法的研究现状进行...
关键词:说话人识别 特征提取 说话人模型 
行车噪声环境下基于人耳频率选择特性的声学特征提取方法被引量:2
《智能计算机与应用》2015年第3期16-18,共3页裴孝中 郑铁然 韩纪庆 
国家自然科学基金(91120303)
本文提出了一种基于加权Mel滤波器组的声学特征提取方法。该方法通过提取音频信号中的共振峰信息,使用动态自适应方法对中高频部分的Mel滤波器组进行加权,从而模仿人耳覆膜的频率选择映射。相比较于传统的MFCC特征,更适用于行车噪声环...
关键词:声学事件检测 鲁棒性特征提取 行车噪声环境 动态自适应 MFCC 
语音关键词检测中置信测度方法研究综述
《智能计算机与应用》2014年第2期10-15,共6页李海洋 韩纪庆 郑贵滨 郑铁然 
国家重点基础研究发展计划(973)(2007CB311104);国家自然科学基金重大研究计划项目(91120303)
语音关键词检测是指在语音文档中寻找并定位特定的词的技术,输入所需查询的关键词通常是以文本的形式给出。作为语音文档分析等技术的核心部分,语音关键词检测始终是语音处理领域研究的热点。置信测度计算是关键词检测技术的重要组成部...
关键词:检测 置信测度 词表外词 
Auditory filter based broadband MUSIC algorithm for sound source localization被引量:7
《Chinese Journal of Acoustics》2013年第4期439-453,共15页LIAO Fengchai LI Peng LIU Wenju 
supported by the National Nature Science Foundation of China(91120303,61273267,90820011);FuJian Nature Science Foundation(2009J01296)
Based on the analysis of the shortcomings of broadband MUSIC algorithm with short-time Fourier transform (SF-MUSIC) for sound source localization, a broadband MUSIC algorithm with auditory filter (AF-MUSIC) was pr...
关键词:MUSIC SF DOA 
检索报告 对象比较 聚类工具 使用帮助 返回顶部