CONFORMER

作品数:57被引量:45H指数:4
导出分析报告
相关领域:理学更多>>
相关作者:许鸿奎努尔麦麦提·尤鲁瓦斯高勇罗均周明亮更多>>
相关机构:山东建筑大学新疆大学长安大学武汉大学更多>>
相关期刊:《无线电工程》《Science Bulletin》《计算机应用研究》《通信技术》更多>>
相关基金:国家自然科学基金河南省自然科学基金博士科研启动基金国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于并行级联时频Conformer生成对抗网络的语音增强算法
《计算机与现代化》2025年第3期22-28,37,共8页王泽宇 韩建宁 郝国栋 杨润 
山西省回国留学人员科研资助项目(2023-127);山西省自然科学基金面上项目(202103021224201)。
生成对抗网络通过对抗训练的机制不断提升网络映射能力,使其具有强大的降噪能力,被广泛应用于语音增强领域。针对现有生成对抗网络语音增强方法存在利用语音特征序列中的时频相关性和全局相关性不充分,去噪性能欠佳的问题,本文提出一种...
关键词:语音增强 生成对抗网络 时频Conformer 指标判别器 对抗训练 
A Weakly Supervised Semantic Segmentation Method Based on Improved Conformer
《Computers, Materials & Continua》2025年第3期4631-4647,共17页Xueli Shen Meng Wang 
In the field of Weakly Supervised Semantic Segmentation(WSSS),methods based on image-level annotation face challenges in accurately capturing objects of varying sizes,lacking sensitivity to image details,and having hi...
关键词:WSSS CAM transformer CNN multi-scale feature extraction LIGHTWEIGHT 
基于语音信号时频特征融合的帕金森病检测方法被引量:1
《郑州大学学报(理学版)》2025年第1期53-60,共8页王晨哲 季薇 郑慧芬 李云 
江苏省高校基础科学(自然科学)重大项目(21KJA520003)。
发音障碍是帕金森病的早期症状之一。近年来,基于语音信号的帕金森病检测的研究大多采用梅尔刻度下的相关语音特征与深度神经网络模型相结合的方法。然而,现有的模型无法充分关注语音信号的全局时序信息,且梅尔刻度特征在准确表征帕金...
关键词:帕金森病 梅尔频率倒谱系数 S-vectors CONFORMER 时频特征融合 
融合双通道卷积和改进型Conformer的两阶段语音增强算法
《电子测量技术》2025年第4期149-157,共9页徐佳瑜 郑展恒 曾庆宁 王健 
认知无线电与信息处理教育部重点实验室项目(CRKL230103)资助。
针对语音关键特征提取不充分、模型结构单一的问题,提出一种两阶段下融合多尺度特征和改进型门控Conformer的语音增强方法。首先,针对关键特征提取不充分的问题,提出双通道卷积融合模块,采用不同感受野的二维卷积多尺度提取语音关键信息...
关键词:深度学习 语音增强 CONFORMER 多尺度特征提取 两阶段 
基于遮蔽多头注意力的CTC-Conformer中文语音识别模型
《智能计算机与应用》2025年第2期162-167,共6页黄天圆 王超 
河北省自然科学基金面上项目(A2020402013)。
Conformer模型是语言处理任务中广泛应用的模型之一,其结合了Transformer模型和卷积神经网络的特点,既能捕捉到局部和全局的序列特征又能更好地理解输入数据的结构和上下文信息。然而,现有Conformer模型中的音频和文本之间对齐关系存在...
关键词:CONFORMER CTC 遮蔽多头注意力 语言处理 
基于双路Conformer的目标说话人提取网络
《电子制作》2025年第3期32-37,共6页丁鑫 夏秀渝 
目标说话人提取指从混合语音中提取出特定目标说话人的语音,而忽略其他干扰音及背景噪声。这一技术在语音信号处理领域具有重要的实际意义和广泛的应用价值。本文提出了一种基于双路Conformer的目标说话人提取网络。该网络由编码器、说...
关键词:深度学习 目标说话人提取 CONFORMER 双路径网络 多任务学习 
基于YOLOV5+Conformer模型课堂智能监测系统设计研究
《信息记录材料》2025年第1期172-175,共4页陈维龙 李红玲 周世俊 康宇暄 索熠承 
江苏省大学生创新训练项目(202413988017Y);2024年高校实验室研究课题项目(2024KWSYS03);江苏省高校哲学社会科学项目(2023SJYB1166)。
随着教育信息化的快速发展,针对传统课堂监测系统存在的精准度不足、数据单一、效率低下等问题,本研究创新性地提出一种高效的多模态交互智能监测系统。首先,针对现有高性能系统模型,设计对比测试方案,选用YOLOV5-BiFPN-Sdet(YOLOv5中S...
关键词:多模态融合 课堂专注力 智能监测 YOLOV5 CONFORMER 
结合字节级别字节对编码的端到端中文语音识别方法
《计算机应用》2025年第1期318-324,共7页付强 徐振平 盛文星 叶青 
湖北省自然科学基金资助项目(2023AFB909)。
针对语音识别中对中文这种复杂字符集的语言词汇表过大以及训练效率太低的问题,提出一种基于字节级别字节对编码(BBPE)的端到端中文语音识别方法。首先,将256个不同的字节用于初始化词汇表;其次,统计每个词汇单元在语料中出现的频率,并...
关键词:语音识别 CONFORMER Zipformer 字节级别字节对编码 端到端 
ACGFN:基于非对称卷积和门控前馈神经网络的语音识别模型
《中文信息学报》2025年第1期167-174,共8页王詠森 刘倩 刘立波 
宁夏回族自治区重点研发计划项目(2022BEG03073);国家自然科学基金(62262053);宁夏科技创新领军人才项目(2022GKLRLX03)。
针对现有基于Conformer语音识别模型对时频特征提取能力不足、模型结构冗余和参数量较大的问题,该文提出一个基于非对称卷积和门控前馈神经网络的语音识别模型ACGFN。首先,采用不同感受野大小的非对称卷积对语音序列的时频特征进行多尺...
关键词:语音识别 端到端 CONFORMER 
基于局部和全局特征提取及多级特征聚合的中文方言识别模型
《华东理工大学学报(自然科学版)》2024年第6期898-904,共7页孟一凡 陈宁 李泓锴 
国家自然科学基金面上项目(61771196)。
与其他语种的方言相比,中文方言种类较多,且方言类间差异小,类内差异大,因此中文方言识别极具挑战性。考虑到中文方言间的差异性可能体现在语音的局部(短时)特性上,也可能体现在语音的全局(长时)特性上,同时还可能反映在语音不同层级的...
关键词:CONFORMER 方言识别 多层级特征聚合 Res2Block 注意力统计池化 
检索报告 对象比较 聚类工具 使用帮助 返回顶部