音频驱动

作品数:39被引量:42H指数:5
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:李新德朱欣娟凌明陈熹程鹏更多>>
相关机构:东南大学联想(北京)有限公司南京硅基智能科技有限公司之江实验室更多>>
相关期刊:《指挥与控制学报》《青岛理工大学学报》《武汉理工大学学报(信息与管理工程版)》《广播电视信息》更多>>
相关基金:国家自然科学基金湖北省自然科学基金上海市高校选拔培养优秀青年教师科研专项基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 主题=音频x
条 记 录,以下是1-10
视图:
排序:
基于UnifiedGesture改进模型的三维人体动画生成
《计算机系统应用》2025年第3期40-50,共11页郭二伟 朱欣娟 高全力 
陕西省科技厅重点研发计划(2024GX-YBXM-548)。
为了提升音频驱动人体动画生成的真实性,对UnifiedGesture模型进行了改进研究.首先,通过引入编码器-解码器架构,从音频中提取面部特征,以弥补原模型在面部表情生成方面的不足.其次,结合交叉局部注意力机制和基于Transformer-XL的多头注...
关键词:音频驱动 人体动画生成技术 UnifiedGesture模型 VQVAE 
融合音频内容、风格和情感特征的人脸动画生成方法
《计算机应用研究》2025年第2期636-640,共5页张欣茹 朱欣娟 高全力 
陕西省重点研发计划资助项目(2024GX-YBXM-548)。
现有的音频驱动人脸动画技术主要注重唇部运动与音频的同步性,忽略了对人物面部表情或头部运动的再现能力。为此,提出了一种融合音频内容、风格和情感特征的高质量人脸动画生成方法(ACSEF)。首先,设计了情感动画模块(EAM),从音频中提取...
关键词:音频驱动 人脸动画 情感动画模块 注意力增强解码器 
基于结构化潜码引导NeRF的语音驱动人脸重演
《计算机辅助设计与图形学学报》2024年第10期1616-1624,共9页谢志峰 郑迦恒 王吉 梁佳佳 马利庄 
上海市自然科学基金(19ZR1419100);上海市级科技重大专项(2021SHZDZX0102);上海市科技创新行动计划人工智能科技支撑项目(21511101200);上海市青年科技英才扬帆计划(22YF1420300).
语音驱动的人脸重演的目标是生成与输入语音内容相匹配的高保真人脸面部动画.然而,由于音频与视频模态之间存在鸿沟,当前方法难以实现高质量的面部重演.针对现有方法保真度低、唇音同步效果差等问题,提出一种基于结构化潜码引导隐式神...
关键词:音频驱动人脸重演 隐式神经表示 神经辐射场 跨模态 
基于语音驱动的说话人脸视频生成综述
《电脑知识与技术》2024年第24期123-126,共4页韩家伟 游锦 
随着人工智能的快速发展,语音驱动的说话人脸生成技术因其在公共安全、医疗、电影娱乐、虚拟数字人等领域的广泛应用而受到越来越多的关注。该技术旨在根据给定的目标人脸和音频,生成自然的说话人脸视频。在过去五年中,研究人员提出了...
关键词:计算机视觉 深度学习 说话人脸生成 音频驱动 数字人 
融合面部深度感知的音频驱动人脸重现方法
《指挥与控制学报》2024年第3期365-371,共7页彭雪康 孙国庆 邵长乐 练智超 
国家重点研发计划(2021YFF0602104-2)资助。
人脸重现是一项条件面部生成任务,现有的基于音频驱动的人脸重现方法难以生成完整且高质量的人脸。针对这一问题,提出一种融合面部深度信息的音频驱动下的人脸重现方法。该方法采用了轻量级的模型框架以降低模型尺寸和提高运行速度。实...
关键词:人脸伪造 人脸重现 深度估计 多模态驱动 生成对抗网络 
改进Wav2Lip的文本音频驱动人脸动画生成
《计算机系统应用》2024年第2期276-283,共8页孙瑜 朱欣娟 
国家重点研发计划(2019YFC1521400)。
为了提高中文唇音同步人脸动画视频的真实性,本文提出一种基于改进Wav2Lip模型的文本音频驱动人脸动画生成技术.首先,构建了一个中文唇音同步数据集,使用该数据集来预训练唇部判别器,使其判别中文唇音同步人脸动画更加准确.然后,在Wav2...
关键词:文本音频驱动 人脸动画 Wav2Lip模型 动画生成 
基于音频驱动的遮挡下人脸表情重建技术
《指挥信息系统与技术》2022年第6期89-94,共6页王航宇 李晓冬 李新德 
信息系统工程重点实验室开放基金(05202003)资助项目。
网络舆情对政治生活秩序和社会稳定的影响与日俱增,还原网络视频中刻意遮挡的人脸,有助于网络舆情管控以及掌握网络舆情攻防战的主动权。结合生成对抗网络,提出了一种基于音频驱动的遮挡下人脸表情重建方法。首先,通过音频解耦器实现音...
关键词:网络舆情 人脸生成 深度学习 生成对抗网络 
音频与动作两种驱动说话人脸视频生成综述
《电子技术与软件工程》2022年第21期174-179,共6页苏红旗 黄玉 李璐 
本文研究的说话人脸视频生成由于在虚拟代理、视频会议、艺术/电影制作中的广泛应用而引起了广泛的研究关注。针对说话人脸视频生成,在驱动方面,主要分为音频驱动和动作驱动,在技术方面,主要分为基于2D和基于3D的方法。在本次调查中,我...
关键词:说话人脸生成 音频驱动 动作驱动 2D 3D 
音频驱动跨模态视觉生成算法综述被引量:2
《图学学报》2022年第2期181-188,共8页姜莱 于震 王鹏飞 周东生 侯亚庆 
国家自然科学基金委-辽宁联合基金项目(U1908214);中央高校基本科研基金项目(DUT21TD107,DUT20RC(3)039);辽宁省兴辽人才计划项目(XLYC2008017);辽宁省重点研发计划项目(2019JH2/10100030);CCF-腾讯犀牛鸟基金项目(IAGR20210116)。
由于音频驱动的跨模态视觉生成算法具有广泛地应用场景,近年来已得到产业界和科研界的广泛关注。音频和视觉为人们日常生活中最重要和常见的2种模态,然而设计一种能够创意地想象出与音频相对应的视觉场景一直是一个巨大挑战,目前关于音...
关键词:跨模态生成 音频 视觉 深度学习 综述 
彻底解决N卡驱动问题的神器
《计算机与网络》2021年第19期34-34,共1页任雅 
很多朋友都是N卡用户,通常来说,人们认为N卡的驱动质量不错,要比竞争对手A卡的来得好。不过N卡驱动也并非没有毛病,例如现在的N卡驱动,往往捆绑了一大堆东西,例如HDMI音频驱动、USB-C驱动、Shield无线手柄驱动等,这些驱动都不一定是用...
关键词:音频驱动 HDMI 驱动问题 占用空间 显卡 游戏直播 掌机 捆绑 
检索报告 对象比较 聚类工具 使用帮助 返回顶部