基于前景-背景运动解耦和多源融合的相机运动可控视频生成  

在线阅读下载全文

作  者:廉旭前 雷印杰[1] 

机构地区:[1]四川大学电子信息学院,四川成都610065

出  处:《电子制作》2025年第7期51-59,共9页Practical Electronics

摘  要:相机运动控制是可控视频生成中的一个重要课题,对其进行精准控制能够实现视角的灵活转换以及视觉焦点的有效引导,显著提升生成视频的动态表现力。针对现有的相机运动控制方法中存在的运动耦合和单参考约束问题,本文提出了一种基于前景-背景运动解耦和多源融合的相机运动可控生成方法。首先通过基于运动分解的相机运动提取模块,将参考视频中的相机运动与物体运动分离,单独提取出其中的相机运动;其次,通过相机运动组合模块整合来自多个参考视频的相机运动,生成联合相机运动。最后,基于稀疏对齐的运动引导模块将相机运动迁移至新生成的视频中,从而实现对视频中相机运动灵活高效的控制。通过与先进的视频生成模型进行对比实验及消融实验对本文模型效果进行了测试。实验结果表明,本文模型在文本对齐和相机运动表现方面优于现有先进算法,充分证明了本文模型在生成相机运动可控视频方面的有效性。

关 键 词:扩散模型 视频生成 人工智能生成内容 相机运动 

分 类 号:TP183[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象