检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张志亮 ZHANG ZhiLiang(Hunan Financial&Industrial Vocational-Technical College,Hengyang 421002,China)
机构地区:[1]湖南财经工业职业技术学院,湖南衡阳421002
出 处:《电视技术》2024年第11期78-81,共4页Video Engineering
摘 要:在计算机和人工智能领域,图像文本跨模态检索受到广泛的关注。然而,当前的图像文本跨模态检索方法往往仅粗略地融合图像文本特征信息,导致所学习的特征信息质量不高。对此,设计融合注意力网络计算的图像文本跨模态检索算法。通过训练该模型,能够挑选出最优的参数,能够有效融合图像文本特征信息,进而学习出信息更丰富的图像文本特征,使得图像和文本的对齐特征更加精准。Image text cross-modal retrieval has received extensive attention in the field of computer and artificial intelligence.However,the existing image text cross-modal retrieval methods usually roughly fuse the image text feature information,which leads to the low quality of the learned feature information.In this paper,an image text cross-modal retrieval algorithm integrating attention network computing is designed.By training the fusion attention network to select the optimal model parameters,the image text feature information can be better fused,and the image text features with richer information can be learned,so that the image and text alignment features are more accurate.
关 键 词:跨模态检索 图像文本特征 融合注意力网络 模型参数
分 类 号:TP311.1[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.149.2.199