基于生成对抗方法的无监督图像描述模型  

Unsupervised image captioning model based on generative adversarial method

在线阅读下载全文

作  者:崔夏雨 邓珍荣 CUI Xiayu;DENG Zhenrong(School of Computer and Information Security,Guilin University of Electronic Technology,Guilin 541004,China)

机构地区:[1]桂林电子科技大学计算机与信息安全学院,广西桂林541004

出  处:《桂林电子科技大学学报》2023年第5期413-421,共9页Journal of Guilin University of Electronic Technology

基  金:广西科技计划(桂科AB20238013)。

摘  要:建立了一种基于生成对抗方法的无监督图像描述(GA-basedUIC)模型,用于图像描述任务。通过将卷积神经网络作为提取图像特征的编码部分,生成对抗式文本生成方法作为产生描述的解码部分,用目标检测算法YOLOv3作为辅助网络来无监督地生成图像的描述。实验结果表明,相较于传统模型,GA-based UIC模型最终生成的描述在BLEU、METEOR、ROUGE和CIDEr等文本评价指标的得分及训练速度均有提升。所提模型为图像描述任务提供了新的解决方案。An unsupervised image description model based on generative adversarial method was proposed for image captioning tasks.By using convolutional neural network as the encoder to extract image features,adversarial text generation method as the de-coder to generate captions was generated,and YOLOv3 as the auxiliary network was used to unsupervised generate captions of im-ages.The results of comparative experiments show that compared with the traditional models,the final captions generated by the GA-based UIC model has a certain improvement in training speed of text evaluation indicators and the scores such as BLEU,METEOR,ROUGE,and CIDEr.The proposal model provides a new solution for the image captioning task.

关 键 词:图像描述 无监督学习 卷积神经网络 生成对抗网络 目标检测 YOLOv3 

分 类 号:TP183[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象