检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘嗣久 荆晓远 任娟 姚永芳 孙其航 LIU Sijiu;JING Xiaoyuan;REN Juan;YAO Yongfang;SUN Qihang
机构地区:[1]吉林化工学院信息与控制学院,吉林吉林132000 [2]广东石油化工学院计算机学院和省市共建石化装备智能安全广东省重点实验室,广东茂名525000
出 处:《信息技术与信息化》2025年第2期151-156,共6页Information Technology and Informatization
基 金:国家自然科学基金项目“基于类不平衡深度特征学习的石化动设备故障信号分类研究”(62176069)。
摘 要:近年来随着人工智能生成内容(AIGC)的发展,图文生成技术取得了显著的进步。然而由于现有大模型本身的技术问题,会存在复杂prompt描述下生成的图片与文本内容不一致且目标完整性不足的问题。为此,文章提出一种基于YOLOv10目标检测和反馈修正机制的AIGC图文生成优化方法。首先,对大模型输入文本指令提示词,让其根据文本指令生成初步图像;接着,应用YOLOv10对生成的初步图像进行目标检测,检测的对象即为文本内容中突出的几个对象;然后将检测到的问题图像和标注信息反馈给扩散模型,扩散模型根据这些反馈对图像进行局部修复,修正缺失的目标或调整目标的位置。实验结果表明,该方法能够显著提高生成图像的目标完整性和与文本描述的对象一致性,与传统方法相比,该机制能够有效地处理生成图像中的问题。其方法为AIGC领域中图像生成与优化提供了一种新的思路和方法。
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.185