颜永红

作品数:144被引量:634H指数:13
导出分析报告
供职机构:中国科学院声学研究所更多>>
发文主题:语音语音识别声学模型音素神经网络更多>>
发文领域:电子电信自动化与计算机技术理学语言文字更多>>
发文期刊:更多>>
所获基金:国家自然科学基金国家高技术研究发展计划中国科学院战略性先导科技专项国家重点基础研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
全变分约束的解卷积常规波束形成方位谱估计算法
《声学学报》2025年第1期68-76,共9页杨泽慧 聂炜航 程高峰 吴姚振 徐及 赵庆卫 颜永红 
国家重点研发计划项目(2021YFC3101403)资助。
为了提高解卷积常规波束形成(D-CBF)算法的稳定性,降低方位谱背景噪声级,提高处理增益,提出了一种基于全变分约束的解卷积常规波束形成(TVD-CBF)空间谱估计算法。该方法利用声源分布的稀疏先验,在代价函数中加入总变分正则化项作为非线...
关键词:方位谱估计 波达方向估计 常规波束形成 解卷积 全变分 
用于水声目标识别的注意力机制特征增强
《声学学报》2024年第4期664-670,共7页任佳威 谢源 徐及 颜永红 
中国科学院声学研究所自导项目(mbdx202107)资助。
提出了一种基于注意力机制的特征增强网络(FEAN)用于水声目标的识别,该方法以水声目标辐射噪声信号的线谱信息和调制信息为基础,采用可学习的注意力模块,一方面依照后端的分类任务,对特征进行线性的自适应滤波操作,保留对分类任务有效...
关键词:水声目标识别 深度学习 注意力机制 特征增强 
针对口音识别中冗余特征及长尾效应的有效方法
《应用声学》2024年第3期498-504,共7页杨壮 颜永红 黄志华 
新疆维吾尔自治区自然科学基金面上项目(2022D01C59);科技部重点研发项目(2018YFC0823402)。
口音识别是指在同一语种下识别不同的区域口音的过程。为了提高口音识别的准确率,采用了多种方法,取得了明显的效果。首先,为了解决声学特征中关键特征权重不突出的问题,引入了有效的注意力机制,并对多种注意力机制进行了比较和分析。...
关键词:口音识别 注意力机制 树形分类 对抗学习 
语言声学智能化的思考与探索被引量:1
《中国科学:物理学、力学、天文学》2022年第4期58-67,共10页颜永红 程高峰 
北京市科学技术委员会(编号:Z211100002521020)资助项目。
人工智能的热潮正在席卷各行各业,声学领域也在进行声学智能化的探索,即如何实现声学技术与人工智能技术的有机融合和应用.本文着重以语言声学为例,同时结合医疗声学,首先分析声学智能化所面临的数据稀缺性、算法自主性、算力依赖性、...
关键词:语言声学 声学智能化 医疗声学 
多语言计算前沿技术专题序言
《计算机科学》2022年第1期7-8,共2页黄河燕 颜永红 黄德根 余正涛 熊德意 
多语言计算,或多语言自然语言处理(Multilingual Natural Language Processing),主要研究如何将自然语言处理技术应用于不同的语言。近年来,多语言计算研究呈现出两个明显趋势。1)多语言自然语言处理技术受到了越来越多研究者的青睐和重...
关键词:自然语言处理 深度神经网络 语言计算 多语种 语言多样性 前沿技术 ACL 
多语言语音识别声学模型建模方法最新进展被引量:11
《计算机科学》2022年第1期47-52,共6页程高峰 颜永红 
随着多媒体信息和通信技术的快速发展,网络上的多语言语音数据日益增多。语音识别作为语音分析与处理的核心技术,如何快速地把中文和英文等少数多资源主要语言处理能力推广到更多的低资源语言,是当前识别技术迫切需要突破的瓶颈。文中...
关键词:多语言 语音识别 声学模型 
深度学习在水下目标被动识别中的应用进展被引量:18
《信号处理》2019年第9期1460-1475,共16页徐及 黄兆琼 李琛 颜永红 
国防科技创新特区项目;中国科学院声学研究所青年英才计划(QNYC201601)
近年来,随着深度学习方法在理论上取得一系列突破性进展,其展现出相对于传统机器学习方法的明显优势。在实际应用方面,深度学习借助其出色的特征学习能力,首先在语音和图像领域取得巨大成功,并迅速引起其他领域研究者们的重点关注。本...
关键词:深度学习 目标识别 被动声纳信号处理 
多语言、复杂环境:挑战语音识别66年
《前沿科学》2019年第2期73-79,共7页颜永红 
随着深度学习的发展,语音识别技术取得了突破性进展,也带动了语音助手、智能音箱等一批应用。然而,复杂声学环境、多语言等难点问题,阻碍了语音识别技术的进一步推广。本文介绍了国内外学者在语音识别领域的最新研究进展,重点分析了生...
关键词:语音识别 复杂声学环境 多语言 对抗网络 端到端 
基于社区结构的集体预测算法研究被引量:1
《网络新媒体技术》2019年第2期24-27,共4页姜亚松 王冰 张艳 颜永红 
国家自然科学基金(编号:11461141004;61271426;U1536117;11504406;11590770-4);中国科学院战略性先导科技专项(面向感知中国的新一代信息技术研究;编号:XDA06030100;XDA06030500;XDA06040603);支持"率先行动"中国博士后科学基金会与中国科学院联合资助优秀博士后项目(编号:2015LH0041);国家863计划(编号:2015AA016306);国家973计划(编号:2013CB329302);新疆维吾尔自治区科技重大专项(编号:201230118-3)经费资助
如果网络结构已知,则可将网络结构特征用于预测任务,集体预测算法则是利用这个思路提高预测效果。传统的集体预测算法主要是基于节点内容和直接邻居节点信息进行预测训练。然而,一些直接邻居节点信息有可能与目标节点不一致。除此之外...
关键词:社区结构 集体预测 模块度 网络 
迭代数控制的稀疏约束波束形成算法
《网络新媒体技术》2018年第5期25-30,共6页曹占中 胡冬妮 李煦 潘接林 颜永红 
国家自然科学基金(批准号:11461141004;61271426;U1536117;11504406;11590770-4);中国科学院战略性先导科技专项(面向感知中国的新一代信息技术研究;编号:XDA06030100;XDA06030500;XDA06040603);国家863计划(编号:2015AA016306);国家973计划(编号:2013CB329302);新疆维吾尔自治区科技重大专项(编号:201230118-3)经费资助
研究了基于L1范数约束的快速迭代算法,分析了其迭代过程以及与波束形成算法相结合的方式。提出了一种基于迭代数控制的波束形成算法,并给出了实现过程。所提算法避免了现有算法对信噪比估计的依赖,并提高了算法在低信噪比环境下的干扰...
关键词:波束形成 稀疏约束 自适应滤波 阵列信号处理 
检索报告 对象比较 聚类工具 使用帮助 返回顶部