检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨冰[1,2] 那巍 向学勤 YANG Bing;NA Wei;XIANG Xue-qin(School of Computer Science and Technology,Hangzhou Dianzi University,Hangzhou 310018,China;Key Laboratory of Brain Machine Collaborative Intelligence of Zhejiang Province,Hangzhou Dianzi University,Hangzhou 310018,China;Hangzhou Lingban Technology Limited Company,Hangzhou 311121,China)
机构地区:[1]杭州电子科技大学计算机学院,浙江杭州310018 [2]杭州电子科技大学浙江省脑机协同智能重点实验室,浙江杭州310018 [3]杭州灵伴科技有限公司,浙江杭州311121
出 处:《浙江大学学报(工学版)》2023年第12期2412-2420,共9页Journal of Zhejiang University:Engineering Science
基 金:浙江省基础公益研究计划(LGG22F020027);国家自然科学基金资助项目(61633010,U1909202)。
摘 要:为了提高生成图像质量,提出新的文本生成图像方法,整体框架采用单阶段文本生成图像主干.在原有模型只使用句子信息生成图像的基础上,使用注意力机制把单词信息融入图像特征,采用合理地融入更多文本信息的方式提高生成图像的质量.引入对比损失,使相同语义图像之间更加接近,不同语义图像之间更加疏远,从而更好地保证文本与生成图像之间的语义一致性.在生成器中采用动态卷积来增强生成器的表达能力.实验结果表明,所提方法在数据集CUB(Fréchet inception distance(FID)从12.10提升到10.36)和数据集COCO(FID从15.41提升到12.74)上都获得了较好的性能提升.A novel text-to-image generation method was proposed to enhance the quality of generated images,utilizing single-stage text-to-image generation backbone.On the basis of the original model that exclusively used sentence information for image generation,an attention mechanism was employed to integrate word information into image features.The quality of generated images was improved by judiciously incorporating additional textual information in a reasonable manner.The introduction of contrast loss makes the same semantic images closer and different semantic images more distant,so as to better ensure the semantic consistency between the text and the generated image.Dynamic convolution was used in the generator to enhance the expression ability of the generator.Experimental results illustrate that the proposed method obtains substantial performance improvements in both the CUB(Fréchet inception distance(FID)from 12.10 to 10.36)and COCO(FID from 15.41 to 12.74)datasets.
关 键 词:文本生成图像 注意力机制 对比损失 语义一致性 动态卷积
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:52.14.77.105