基于YOLOv10的AIGC图文生成优化与反馈修正方法  

在线阅读下载全文

作  者:刘嗣久 荆晓远 任娟 姚永芳 孙其航 LIU Sijiu;JING Xiaoyuan;REN Juan;YAO Yongfang;SUN Qihang

机构地区:[1]吉林化工学院信息与控制学院,吉林吉林132000 [2]广东石油化工学院计算机学院和省市共建石化装备智能安全广东省重点实验室,广东茂名525000

出  处:《信息技术与信息化》2025年第2期151-156,共6页Information Technology and Informatization

基  金:国家自然科学基金项目“基于类不平衡深度特征学习的石化动设备故障信号分类研究”(62176069)。

摘  要:近年来随着人工智能生成内容(AIGC)的发展,图文生成技术取得了显著的进步。然而由于现有大模型本身的技术问题,会存在复杂prompt描述下生成的图片与文本内容不一致且目标完整性不足的问题。为此,文章提出一种基于YOLOv10目标检测和反馈修正机制的AIGC图文生成优化方法。首先,对大模型输入文本指令提示词,让其根据文本指令生成初步图像;接着,应用YOLOv10对生成的初步图像进行目标检测,检测的对象即为文本内容中突出的几个对象;然后将检测到的问题图像和标注信息反馈给扩散模型,扩散模型根据这些反馈对图像进行局部修复,修正缺失的目标或调整目标的位置。实验结果表明,该方法能够显著提高生成图像的目标完整性和与文本描述的对象一致性,与传统方法相比,该机制能够有效地处理生成图像中的问题。其方法为AIGC领域中图像生成与优化提供了一种新的思路和方法。

关 键 词:YOLOv10 人工智能生成内容(AIGC) 扩散模型 目标检测 图像生成 反馈修正 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] TP391.1[自动化与计算机技术—控制科学与工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象