基于生成对抗网络的文本转图像研究  被引量:1

TEXT-TO-IMAGE BASED ON GENERATIVE ADVERSARIAL NETWORK

在线阅读下载全文

作  者:李校林[1,2,3] 高雨薇 付国庆 Li Xiaolin;Gao Yuwei;Fu Guoqing(School of Communication and Information Engineering,Chongqing University of Posts and Telecommunications,Chongqing 400065,China;Research Center of New Telecommunication Technology Applications,Chongqing University of Posts and Telecommunications,Chongqing 400065,China;Chongqing Information Technology Designing Co.,Ltd.,Chongqing 401121,China)

机构地区:[1]重庆邮电大学通信与信息工程学院,重庆400065 [2]重庆邮电大学通信新技术应用研究中心,重庆400065 [3]重庆信息设计有限公司,重庆401121

出  处:《计算机应用与软件》2024年第3期188-193,219,共7页Computer Applications and Software

基  金:重庆市教育委员会科学技术研究项目(KJQN202000647)。

摘  要:近几年,生成对抗网络(Generative Adversarial Network, GAN)在文本转图像中已经取得了显著成果,但是当生成复杂图像时,一些重要的细粒度信息常常会丢失,包括图像边缘模糊、局部纹理不清晰等问题。为了解决上述问题,在堆叠式生成对抗网络(Stack GAN)基础上,该文提出一种基于深度注意力的堆叠式生成对抗网络模型(Deep Attention Stack GAN, DAS-GAN),模型第一个阶段生成图像的基本轮廓和颜色,第二个阶段部分外观和颜色的补充和校正,最后一个阶段细化图像的纹理细节。通过在CUB数据集上实验的初始得分发现,DAS-GAN相比StackGAN++和AttnGAN分别提高了0.296和0.078,从而证明了该模型的有效性。In recent years,generative adversarial network(GAN)has achieved remarkable results in text-to-image conversion,but when generating complex images,some important fine-grained information is often lost,including problems such as blurred image edges and unclear local textures.In order to solve the above problems,on the basis of Stack GAN,a deep attention stack GAN(DAS-GAN)is proposed.The first stage of the model generated the basic outline and color of the image,the second stage added and corrected the partial appearance and color,and the last stage refined the texture details of the image.Through the initial scores of experiments on the CUB data set,it is found that DAS-GAN is 0.296 and 0.078 higher than StackGAN++and AttnGAN,which verifies the effectiveness of the model.

关 键 词:生成对抗网络 深度学习 文本转图像 深度注意力 DAS-GAN 

分 类 号:TP393.08[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象