刘加

作品数:130被引量:619H指数:13
导出分析报告
供职机构:清华大学更多>>
发文主题:语音识别说话人识别语种识别语音语音信号处理更多>>
发文领域:电子电信自动化与计算机技术语言文字文化科学更多>>
发文期刊:《电子技术应用》《声学学报》《电视技术》《电声技术》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划北京市自然科学基金国家科技支撑计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
采用注意力机制和多任务训练的端到端无语音识别关键词检索系统被引量:20
《信号处理》2020年第6期839-851,共13页赵泽宇 张卫强 刘加 
NSFC-通用技术基础研究联合基金重点项目(U1836219)。
传统的关键词搜索(KWS,Keyword Search)系统依靠自动语音识别(ASR,Automatic Speech Recognition),通常在资源不足的情况下很难训练。为了免去训练完整的语音识别系统,无语音识别(ASR-free)的关键词检索系统受到越来越多的欢迎。本文提...
关键词:关键词检索 语音识别 端到端 低资源语种 
一种联合频谱和空间特征的深度学习多通道语音增强算法被引量:5
《电子测量技术》2019年第18期90-94,共5页邓贺元 刘加 夏善红 彭春荣 
国家自然科学基金(U1836219)资助项目
近年来,越来越多的电子产品使用麦克风阵列,而且与传统多通道语音增强算法相比,基于深度学习的算法效果更好,为了进一步提高增强效果,提出一种联合频谱特征和空间特征的深度学习算法。该算法包括两个部分,第一部分,使用频谱和通道间相...
关键词:深度学习 时间频率掩蔽值 空间特征 波束成形 
基于多状态跳转模型的场景独立音频事件检测方法
《中国科学院大学学报(中英文)》2019年第2期218-225,共8页王健飞 张卫强 刘加 
国家自然科学基金(U1836219)资助
针对不同类型事件设计多状态跳转模型,结合两种深度神经网络实现对传统音频事件检测框架的改进。实验表明,在DCASE2017任务2的开发集数据上,改进后的DNN-HMM系统相比于基线系统取得F值8.9%的相对提升和错误率19%的绝对下降;基于多状态...
关键词:音频事件检测 多状态跳转模型 深度神经网络 迁移学习 多任务学习 
WFST解码器词图生成算法中的非活跃节点检测与内存优化
《中国科学院大学学报(中英文)》2019年第1期109-114,共6页丁佳伟 刘加 张卫强 冯运波 刘利军 于乐 
国家自然科学基金(U1836219)资助
解码器引擎是语音识别系统的核心模块,而基于加权有限状态机(WFST)的解码器则是解码器的一种典型形式。分析静态WFST解码器在实际应用中的资源占用问题,提出一种在解码和词图生成过程中通过检测非活跃节点动态回收系统资源的策略。最后,...
关键词:语音识别解码器 加权有限状态机 工程应用 内存回收 
基于计算听觉场景分析的说话人转换检测被引量:1
《计算机工程》2018年第2期316-321,共6页杨登舟 刘加 夏善红 
国家自然科学基金"噪声和短语音条件下的说话人识别"(61370034)
在短时语音说话人快速转变的说话人转换检测中,用于训练说话人模型的连续语音较短导致模型不稳健,致使说话人转换检测的性能较差。为此,提出一种新的说话人转换检测方法。借鉴人耳听觉处理机制将语音信号分解为多个子带,可以得到准确的...
关键词:说话人转换检测 计算听觉场景分析 伽马通能量倒谱系数 音高 贝叶斯信息准则 
深度神经网络自适应中基于身份认证向量的归一化方法被引量:6
《中国科学院大学学报(中英文)》2017年第5期633-639,共7页杨建斌 张卫强 刘加 
国家自然科学基金(61370034;61403224)资助
深度神经网络是近年来非常流行的一种语音识别声学建模技术,其性能比之前主流的高斯混合模型有显著提高,但是深度神经网络的说话人自适应技术一直没有很好地解决。利用身份认证向量对深度神经网络进行自适应,并研究身份认证向量归一化...
关键词:身份认证向量 深度神经网络 说话人自适应 归一化 
低资源语音识别若干关键技术研究进展被引量:8
《数据采集与处理》2017年第2期205-220,共16页刘加 张卫强 
国家自然科学基金(61370034;61403224)资助项目
低资源语音识别是当今语音界研究的热点问题之一,也是多语言小语种语音识别技术在实际应用中所面临的重要挑战之一。本文回顾并总结了低资源语音识别的发展历史和研究现状,重点介绍了低资源语音识别在声学特征、声学模型和语言模型方面...
关键词:语音识别 低资源 声学模型 语言模型 
低资源条件下基于i-vector特征的LSTM递归神经网络语音识别系统被引量:22
《计算机应用研究》2017年第2期392-396,共5页黄光许 田垚 康健 刘加 夏善红 
国家自然科学基金资助项目(61273268;61370034;61403224)
在低资源条件下,由于带标注训练数据较少,搭建的语音识别系统性能往往不甚理想。针对此问题,首先在声学模型上研究了长短时记忆(LSTM)递归神经网络,通过对长序列进行建模来充分挖掘上下文信息,并且引入线性投影层减小模型参数;然后研究...
关键词:语音识别 长短时记忆神经网络 身份认证矢量 
基于深度神经网络和Bottleneck特征的说话人识别系统被引量:13
《清华大学学报(自然科学版)》2016年第11期1143-1148,共6页田垚 蔡猛 何亮 刘加 
国家自然科学基金资助项目(61273268,61370034,61403224)
近来,一种结合语音识别中深度神经网络(deep neural network,DNN)模型和说话人识别中身份认证矢量(identity vector,i-vector)模型的方法被证明对说话人识别十分有效。为了进一步提升系统性能,该文提出使用基于说话人标签的DNN模型...
关键词:说话人识别 深度神经网络 Bottleneck特征 
电能计量装置状态评估系统开发及实现被引量:2
《电子世界》2016年第19期186-190,共5页蔡耀年 刘加 米晓霞 柳荟 
电能计量装置运行状态直接关系到用户电能交易的准确性,对电能计量装置的运行状态评估显得尤为重要。本文针对现行计量装置状态评估指标的不确定性和各评估方法结果的不一致性,提出基于数据集成技术、可视化技术、组件技术、Web Servic...
关键词:电能计量 装置 状态评估 综合集成技术 系统 
检索报告 对象比较 聚类工具 使用帮助 返回顶部