CONFORMER

作品数:55被引量:43H指数:3
导出分析报告
相关领域:理学更多>>
相关作者:许鸿奎努尔麦麦提·尤鲁瓦斯高勇罗均周明亮更多>>
相关机构:山东建筑大学新疆大学长安大学武汉大学更多>>
相关期刊:《今日中国(法文版)》《北京师范大学学报(自然科学版)》《科学技术与工程》《计算机工程与应用》更多>>
相关基金:国家自然科学基金博士科研启动基金河南省自然科学基金国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
A Weakly Supervised Semantic Segmentation Method Based on Improved Conformer
《Computers, Materials & Continua》2025年第3期4631-4647,共17页Xueli Shen Meng Wang 
In the field of Weakly Supervised Semantic Segmentation(WSSS),methods based on image-level annotation face challenges in accurately capturing objects of varying sizes,lacking sensitivity to image details,and having hi...
关键词:WSSS CAM transformer CNN multi-scale feature extraction LIGHTWEIGHT 
基于语音信号时频特征融合的帕金森病检测方法被引量:1
《郑州大学学报(理学版)》2025年第1期53-60,共8页王晨哲 季薇 郑慧芬 李云 
江苏省高校基础科学(自然科学)重大项目(21KJA520003)。
发音障碍是帕金森病的早期症状之一。近年来,基于语音信号的帕金森病检测的研究大多采用梅尔刻度下的相关语音特征与深度神经网络模型相结合的方法。然而,现有的模型无法充分关注语音信号的全局时序信息,且梅尔刻度特征在准确表征帕金...
关键词:帕金森病 梅尔频率倒谱系数 S-vectors CONFORMER 时频特征融合 
基于遮蔽多头注意力的CTC-Conformer中文语音识别模型
《智能计算机与应用》2025年第2期162-167,共6页黄天圆 王超 
河北省自然科学基金面上项目(A2020402013)。
Conformer模型是语言处理任务中广泛应用的模型之一,其结合了Transformer模型和卷积神经网络的特点,既能捕捉到局部和全局的序列特征又能更好地理解输入数据的结构和上下文信息。然而,现有Conformer模型中的音频和文本之间对齐关系存在...
关键词:CONFORMER CTC 遮蔽多头注意力 语言处理 
基于双路Conformer的目标说话人提取网络
《电子制作》2025年第3期32-37,共6页丁鑫 夏秀渝 
目标说话人提取指从混合语音中提取出特定目标说话人的语音,而忽略其他干扰音及背景噪声。这一技术在语音信号处理领域具有重要的实际意义和广泛的应用价值。本文提出了一种基于双路Conformer的目标说话人提取网络。该网络由编码器、说...
关键词:深度学习 目标说话人提取 CONFORMER 双路径网络 多任务学习 
基于YOLOV5+Conformer模型课堂智能监测系统设计研究
《信息记录材料》2025年第1期172-175,共4页陈维龙 李红玲 周世俊 康宇暄 索熠承 
江苏省大学生创新训练项目(202413988017Y);2024年高校实验室研究课题项目(2024KWSYS03);江苏省高校哲学社会科学项目(2023SJYB1166)。
随着教育信息化的快速发展,针对传统课堂监测系统存在的精准度不足、数据单一、效率低下等问题,本研究创新性地提出一种高效的多模态交互智能监测系统。首先,针对现有高性能系统模型,设计对比测试方案,选用YOLOV5-BiFPN-Sdet(YOLOv5中S...
关键词:多模态融合 课堂专注力 智能监测 YOLOV5 CONFORMER 
结合字节级别字节对编码的端到端中文语音识别方法
《计算机应用》2025年第1期318-324,共7页付强 徐振平 盛文星 叶青 
湖北省自然科学基金资助项目(2023AFB909)。
针对语音识别中对中文这种复杂字符集的语言词汇表过大以及训练效率太低的问题,提出一种基于字节级别字节对编码(BBPE)的端到端中文语音识别方法。首先,将256个不同的字节用于初始化词汇表;其次,统计每个词汇单元在语料中出现的频率,并...
关键词:语音识别 CONFORMER Zipformer 字节级别字节对编码 端到端 
ACGFN:基于非对称卷积和门控前馈神经网络的语音识别模型
《中文信息学报》2025年第1期167-174,共8页王詠森 刘倩 刘立波 
宁夏回族自治区重点研发计划项目(2022BEG03073);国家自然科学基金(62262053);宁夏科技创新领军人才项目(2022GKLRLX03)。
针对现有基于Conformer语音识别模型对时频特征提取能力不足、模型结构冗余和参数量较大的问题,该文提出一个基于非对称卷积和门控前馈神经网络的语音识别模型ACGFN。首先,采用不同感受野大小的非对称卷积对语音序列的时频特征进行多尺...
关键词:语音识别 端到端 CONFORMER 
基于局部和全局特征提取及多级特征聚合的中文方言识别模型
《华东理工大学学报(自然科学版)》2024年第6期898-904,共7页孟一凡 陈宁 李泓锴 
国家自然科学基金面上项目(61771196)。
与其他语种的方言相比,中文方言种类较多,且方言类间差异小,类内差异大,因此中文方言识别极具挑战性。考虑到中文方言间的差异性可能体现在语音的局部(短时)特性上,也可能体现在语音的全局(长时)特性上,同时还可能反映在语音不同层级的...
关键词:CONFORMER 方言识别 多层级特征聚合 Res2Block 注意力统计池化 
基于Conformer-SE的端到端语音识别
《计算机系统应用》2024年第12期106-114,共9页马永杰 李罡 
2022年度吉林省教育厅科学技术研究项目(JJKH20220013KJ);2023年大学生创新创业训练计划(202310206035)。
基于自注意力机制的Transformer端到端模型在语音识别任务中表现出了卓越的性能.然而,该模型在浅层处理时对局部特征信息的捕捉能力存在一定的局限,同时也没有充分考虑不同块之间的相互依赖性.为了解决这些问题,提出了一种改进的Conform...
关键词:语音识别 端到端 TRANSFORMER CONFORMER SE注意力通道 
基于特征提示的跨语种语音识别模型
《科学技术与工程》2024年第24期10348-10355,共8页王嘉文 高定国 索朗曲珍 尼琼 
国家自然科学基金(62166038);四川省科技计划基金(2023YFQ0044);西藏大学高水平人才培养计划项目(2021-GSP-S126)。
跨语种语音识别是一种利用多种源语言的数据来训练一个能够识别目标语言的语音识别系统,它可以促进不同语言和文化之间的交流和理解。为解决跨语种语音识别存在着如何利用多语种数据来提高低资源语言的识别性能,源语言和目标语言之间的...
关键词:特征提示 跨语种 语音识别 CONFORMER Contextnet 
检索报告 对象比较 聚类工具 使用帮助 返回顶部