音频与动作两种驱动说话人脸视频生成综述  

在线阅读下载全文

作  者:苏红旗[1] 黄玉 李璐[1] 

机构地区:[1]中国矿业大学(北京)机电与工程学院,北京市100083

出  处:《电子技术与软件工程》2022年第21期174-179,共6页ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING

摘  要:本文研究的说话人脸视频生成由于在虚拟代理、视频会议、艺术/电影制作中的广泛应用而引起了广泛的研究关注。针对说话人脸视频生成,在驱动方面,主要分为音频驱动和动作驱动,在技术方面,主要分为基于2D和基于3D的方法。在本次调查中,我们首先分别总结了人脸视频生成的音频和动作这两种驱动基于2D和3D两种方法的国内外最新进展和技术趋势,并对关键技术原理进行了详细的解释与分析。其次总结了该领域使用的基准数据集和评估指标。最后我们希望这项调查能够为深度人的生成的未来前景提供一些启示,并为数字人的全面应用提供有益的基础。

关 键 词:说话人脸生成 音频驱动 动作驱动 2D 3D 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象