基于扩散模型的文本连续性插画生成  

在线阅读下载全文

作  者:徐任政 姚剑敏[1,2] 陈恩果 严群[1] XU Renzheng;YAO Jianmin;CHEN En'guo;YAN Qun

机构地区:[1]福州大学,福建福州350108 [2]晋江市博感电子科技有限公司,福建晋江362200

出  处:《信息技术与信息化》2024年第4期24-27,共4页Information Technology and Informatization

基  金:国家重点研发计划(2022YFB3603503);福建省技术攻关重点项目(2023G007)。

摘  要:基于扩散模型的生成能力,提出了一种基于扩散模型的文本连续性插画的生成方法。其目标是根据给定的文本输入,生成连续的插画,以便更好地传达文本的意思。在扩散模型的基础上,加入了LSTM神经网络模型,使扩散模型在原本只能根据一句或者一段文本来生成一张图片的基础上加以改进,之后可以通过一段或多段文本,通过LSTM进行预处理,再生成一系列连续性的图片。所提方法主要是利用LSTM神经网络模型在序列建模方面的优势,它能很好地捕捉序列数据中的长期依赖关系,从而更好地理解和建模序列中的上下文信息。将预处理好的源文本送入生成模型,通过生成模型的生成能力,最后输出一系列连续的图片。

关 键 词:扩散模型 深度学习 插画生成 连续性 LSTM神经网络模型 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象