音频驱动

作品数:39被引量:42H指数:5
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:李新德朱欣娟凌明陈熹程鹏更多>>
相关机构:东南大学联想(北京)有限公司南京硅基智能科技有限公司之江实验室更多>>
相关期刊:《指挥与控制学报》《青岛理工大学学报》《武汉理工大学学报(信息与管理工程版)》《广播电视信息》更多>>
相关基金:国家自然科学基金湖北省自然科学基金上海市高校选拔培养优秀青年教师科研专项基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机系统应用x
条 记 录,以下是1-2
视图:
排序:
基于UnifiedGesture改进模型的三维人体动画生成
《计算机系统应用》2025年第3期40-50,共11页郭二伟 朱欣娟 高全力 
陕西省科技厅重点研发计划(2024GX-YBXM-548)。
为了提升音频驱动人体动画生成的真实性,对UnifiedGesture模型进行了改进研究.首先,通过引入编码器-解码器架构,从音频中提取面部特征,以弥补原模型在面部表情生成方面的不足.其次,结合交叉局部注意力机制和基于Transformer-XL的多头注...
关键词:音频驱动 人体动画生成技术 UnifiedGesture模型 VQVAE 
改进Wav2Lip的文本音频驱动人脸动画生成
《计算机系统应用》2024年第2期276-283,共8页孙瑜 朱欣娟 
国家重点研发计划(2019YFC1521400)。
为了提高中文唇音同步人脸动画视频的真实性,本文提出一种基于改进Wav2Lip模型的文本音频驱动人脸动画生成技术.首先,构建了一个中文唇音同步数据集,使用该数据集来预训练唇部判别器,使其判别中文唇音同步人脸动画更加准确.然后,在Wav2...
关键词:文本音频驱动 人脸动画 Wav2Lip模型 动画生成 
检索报告 对象比较 聚类工具 使用帮助 返回顶部