检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:朱家群[1] 王东阳 顾玉宛[1] 徐守坤[1] ZHU Jiaqun;WANG Dongyang;GU Yuwan;XU Shoukun(School of Computer Science and Artificial Intelligence,Changzhou University,Changzhou 213164,China)
机构地区:[1]常州大学计算机与人工智能学院,江苏常州213164
出 处:《常州大学学报(自然科学版)》2023年第6期35-44,共10页Journal of Changzhou University:Natural Science Edition
基 金:国家自然科学基金资助项目(61906021)。
摘 要:提出了一种融合深度神经网络和Transformer特征的多尺度结构,目的在于解决在同一场景下出现尺寸不同的目标时,显著目标检测网络性能下降的问题。当处理不同尺度的物体时,由于采样深度和感受野尺寸之间的矛盾,现有方法的表现往往不稳定。为了应对这一挑战,采取了3种不同的采样率对特征图进行采样,并使用Transformer模块来学习全局上下文信息。这种方法可以将卷积神经网络(CNNs)和Transformer两种网络的特性进行有效融合,从而创新性地提出了一种针对多尺度物体的显著目标检测策略。在UHRSD-TE,DUT-OMRON和DUTS-TE 3个公开数据集上的实验结果证明,该方法在处理同一场景下不同尺寸物体的显著目标检测任务上表现优秀。This paper proposes a multi-scale structure that integrates deep neural networks and Transformer features,aiming to address the issue of performance degradation in salient object detection networks when objects of different sizes appear in the same scene.When dealing with objects of different scales,the performance of existing methods often fluctuates due to the contradiction between sampling depth and receptive field size.To tackle this challenge,three different sampling rates were adopted to sample the feature maps, and the Transformer module was used to learn global context information. This method enables the effective fusion of the characteristics of Convolutional Neural Networks (CNNs) and Transformer networks, thereby innovatively proposing a salient object detection strategy for multi-scale objects. Experimental results on three public datasets, UHRSD-TE, DUT-OMRON, and DUTS-TE, demonstrate that this method performs excellently in the task of salient object detection for objects of different sizes in the same scene.
关 键 词:神经网络 TRANSFORMER 多尺度分析 显著性目标检测
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.225.72.2