戴礼荣

作品数:134被引量:490H指数:11
导出分析报告
供职机构:中国科学技术大学更多>>
发文主题:语音识别语音合成说话人确认神经网络语音更多>>
发文领域:电子电信自动化与计算机技术语言文字机械工程更多>>
发文期刊:《计算机应用与软件》《计算机应用研究》《小型微型计算机系统》《天津大学学报(自然科学与工程技术版)》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划安徽省自然科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
钢琴音乐转写中音乐相关特性研究
《小型微型计算机系统》2024年第10期2305-2311,共7页单小岩 张结 戴礼荣 
国家自然科学基金项目(62101523)资助;合肥市自然科学基金项目(2022012)资助;中央高校基本科研业务经费项目(YD2100002008)资助.
自动音乐转写,即利用程序将音乐音频转写成音符的形式,是音乐信息检索的一项重要课题.目前基于深度学习的转写算法多源自语音识别、自然语言处理等领域,缺乏对音乐自身特性的深入研究.本文采用Transformer架构进行钢琴音乐转写,利用合...
关键词:钢琴音乐转写 TRANSFORMER 合成音乐预训练 音符事件特性 目标检测 
神经网络分类算法驱动的口译教学语料难度分级系统被引量:1
《中国翻译》2023年第3期71-80,190,共11页刘晨璇 王吟颖 李小喜 戴礼荣 
国家社科基金项目“‘一带一路’背景下以中文为轴心语言的口笔译路径研究”(项目编号:20BYY030);上海市脑机协同信息行为重点实验室课题“远程工作模式下同声传译员的压力管理”(课题批准号:2021KFKT003)的阶段性研究成果。
教学语料设计是口译教学的重要组成部分。学界对口译教材建设的现状和语料难度影响因素有一定的研究,但影响难度的变量众多且关系复杂,难度划分主要依赖于专家经验,缺乏统一、可靠的分级标准。从机器学习的角度看,教学语料的难度分级可...
关键词:教材 教学语料库 难度 分类算法 RoBERTa 数据增强 
分布式麦克风网络中降噪低复杂度能量感知传感器选择
《中国科学技术大学学报》2023年第4期12-21,I0008,共11页张结 许露真 戴礼荣 
supported by the National Natural Science Foundation of China (62101523);Hefei Municipal Natural Science Foundation (2022012);Fundamental Research Funds for the Central Universities (WK2100000016);USTC Research Funds of the Double First-Class Initiative (YD2100002008)。
降噪(NR)是许多音频应用系统改善信号质量的必要前端模块。研究表明,稀疏促进的传感器选择方法具有权衡能量消耗和降噪性能的能力,这对大规模无线声学传感器网络(WASNs)非常重要,因为其中很多传感器对降噪的贡献甚微,但是能耗会影响无...
关键词:传感器选择 前向/后向算法 梯度 实体 MVDR波束形成 语音增强 分布式麦克风阵列 
基于卷积神经网络的语种识别系统被引量:7
《数据采集与处理》2019年第2期322-330,共9页金马 宋彦 戴礼荣 
国家自然科学基金(U1613211)资助项目
从给定语音中提取有效语音段表示是语种识别的关键点。近年来深度学习在语种识别应用中有重要的进展,通过深度神经网络可以提取音素相关特征,并有效提升系统性能。基于深度学习的端对端语种识别系统也表现出其优异的识别性能。本文针对...
关键词:语种识别 卷积神经网络 语音段表示 语种区分性基本单元 端对端机制 
I-vector聚类字典及注意力机制框架的说话人自适应被引量:5
《小型微型计算机系统》2019年第2期460-464,共5页黄俊 蒋兵 李先刚 郭武生 戴礼荣 
国家重点研发计划项目(2017YFB1002200)资助
近些年来,语音识别任务中的说话人自适应技术在实际工程中得到广泛应用.基于i-vector的说话人自适应是其中最为重要的一种,但是提取i-vector需要用到整句话的信息,并不能用于线上的自适应.因此,本文设计了一种基于i-vector聚类字典及注...
关键词:i-vector字典 注意力机制 说话人自适应 语音识别 
基于多通道视觉注意力的细粒度图像分类被引量:14
《数据采集与处理》2019年第1期157-166,共10页王培森 宋彦 戴礼荣 
国家自然科学基金(U1613211)资助项目
视觉注意力机制在细粒度图像分类中得到了广泛的应用。现有方法多是构建一个注意力权重图对特征进行简单加权处理。对此,本文提出了一种基于可端对端训练的深度神经网络模型实现的多通道视觉注意力机制,首先通过多视觉注意力图描述对应...
关键词:图像分类 细粒度图像分析 视觉注意力 图像表示 深度学习 
学习长短时记忆网络的紧密结构被引量:6
《小型微型计算机系统》2018年第11期2409-2412,共4页陈皇 戴礼荣 张仕良 黄俊 
国家重点研发计划项目(2017YFB1002200)资助
近些年来,在语音识别任务上,前馈神经网络与长短时记忆网络等模型取得了突出的性能表现.然而,这些神经网络对其所要部署设备的内存资源与计算效率有较高的要求,这极大的阻碍了神经网络在移动设备上的应用.事实上大部分的神经网络都存在...
关键词:长短时记忆网络 语音识别 模型压缩 
基于深度学习的语音识别技术现状与展望被引量:73
《数据采集与处理》2017年第2期221-231,共11页戴礼荣 张仕良 黄智颖 
安徽省科技重大专项(15czz02007)资助项目;国家重点研发计划(2016YFB1001300)资助项目
首先对深度学习的发展历史以及概念进行简要的介绍。然后回顾最近几年基于深度学习的语音识别的研究进展。这一部分内容主要分成以下5点进行介绍:声学模型训练准则,基于深度学习的声学模型结构,基于深度学习的声学模型训练效率优化,基...
关键词:深度学习 深度神经网络 语音识别 说话人自适应 
自由表述口语语音评测后验概率估计改进方法被引量:5
《中文信息学报》2017年第2期212-219,共8页许苏魁 戴礼荣 魏思 刘庆峰 高前勇 
国家自然科学基金(61273264)
该文研究了两种用于改善深度神经网络声学建模框架下自由表述口语语音评测任务后验概率估计的方法:1)使用RNN语言模型对一遍解码N-best候选做语言模型得分重估计来获得更准确的识别结果以重新估计后验概率;2)借鉴多语种神经网络训练框架...
关键词:自由表述口语 语音评测 后验概率 深度神经网络 RNN语言模型 
采用深度神经网络的说话人特征提取方法被引量:8
《小型微型计算机系统》2017年第1期142-146,共5页张涛涛 陈丽萍 蒋兵 戴礼荣 
国家自然科学基金项目(61273264)资助
在说话人确认中,通常采用的声学特征(如MFCC,PLP特征等)包含的主要是文本信息和信道信息,说话人信息属于其中的弱信息,极易受到语音信号中的文本信息及信道、噪声等干扰的影响.针对这个问题,提出一种基于深度神经网络提取语音信号中说...
关键词:说话人确认 深度神经网络 DN特征 
检索报告 对象比较 聚类工具 使用帮助 返回顶部