语音驱动

作品数:54被引量:64H指数:4
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:谢磊李冰锋熊盛武高文王兆其更多>>
相关机构:西北工业大学中国科学院自动化研究所中国科学院中国科学技术大学更多>>
相关期刊:《广播与电视技术》《清华大学学报(自然科学版)》《计算机与数字工程》《计算机与现代化》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划陕西省自然科学基金陕西省科学技术研究发展计划项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
情感可控的个性化完整三维虚拟形象表情动画生成被引量:1
《信号处理》2025年第2期382-398,共17页李俊沂 庞德龙 蔡明旭 周圣喻 余旻婧 
国家自然科学基金(62002258);北京市自然科学基金(L222113)。
语音驱动的三维虚拟形象情感表情动画,旨在合成与输入语音具有同步嘴唇动作和面部表情的三维人脸动画。然而,现有方法受限于三维人脸先验,在合成具有口腔内部结构的三维人脸动画方面存在一定的局限性,导致最终生成结果缺乏真实感。此外...
关键词:语音驱动 情绪驱动 三维虚拟形象 面部表情动画 
基于Omniverse Audio2Face的语音驱动数字人三维面部动画生成技术应用研究
《现代电影技术》2025年第2期45-52,共8页苏文吉 鲁梦河 
北京电影学院人才队伍建设资助计划--创新团队项目“电影智能制作中的艺术与科学融合发展研究”(3040025002)。
为提升数字人三维面部动画的真实感与数字人交互体验,并探索传统高成本面部捕捉技术的替代方案,本文对语音驱动数字人面部动画方法展开研究,基于Omniverse Audio2Face工具,通过语音输入实现对虚幻引擎MetaHuman数字人面部动画的驱动流...
关键词:数字人 三维面部动画 语音驱动 人工智能 
基于语音驱动的人脸生成
《计算机科学与应用》2025年第1期199-208,共10页李昊渊 
语音驱动人脸生成旨在生成与参考人脸具有相同身份信息,与语音内容相对应的说话人脸视频。针对现有方法中生成人脸身份信息较差、脸部细节较差的问题,提出了一种基于关键点的语音驱动说话人脸视频生成模型LTFG-GAN。该模型首先将基于在...
关键词:人脸生成 深度学习 Wav2vec 交叉注意力机制 条件卷积 
语音驱动说话数字人视频生成方法综述
《电子科技大学学报》2024年第6期911-921,共11页刘颖 李济廷 柴瑞坤 位纪伟 杨阳 
国家自然科学基金(62306067)。
近年来,深度学习技术的飞速发展极大地推动了虚拟数字人技术的进步,尤其是在说话数字人视频生成方面。该领域的研究在视频翻译、电影制作和虚拟助手等多个场景中展现出广阔的应用前景。该文对当前语音驱动说话数字人视频生成方法及研究...
关键词:说话数字人 视频生成 生成对抗模型 扩散模型 神经辐射场 多模态融合 
数字说话人脸生成技术综述
《大数据》2024年第5期74-95,共22页张冰源 张旭龙 王健宗 程宁 肖京 
广东省重点领域研发计划“新一代人工智能”重大专项(No.2021B0101400003)。
在现代计算机视觉和自然语言处理的交叉领域,数字说话人脸生成技术已经成为一个越来越重要的研究主题。数字说话人脸生成技术专注于依据预定的文本或音频序列生成逼真的人脸图像。近年来,深度学习方法,如卷积神经网络、生成对抗性网络...
关键词:数字说话人脸生成 虚拟人 语音驱动 
基于语音驱动的风格化数字人关键技术研究与应用示范
《广播与电视技术》2024年第10期20-23,共4页郝洺 张翀 冯海亮 施玉海 
广科院2024基本科研项目《生成式人工智能应用于视频生成的安全评估技术研究》(24011401),2024年广科院实验室运行维护经费(240305)资助。
近年来,数字人技术的应用正逐渐成为推动媒体融合发展的重要力量。本文提出了一种基于语音驱动的风格化数字人技术框架,旨在为广电领域提供一种新的技术解决方案。该框架通过语音生成、唇形同步、面部风格化等AI技术生成数字人,在保留...
关键词:语音驱动 风格化 数字人 唇形同步 会馆 
基于结构化潜码引导NeRF的语音驱动人脸重演
《计算机辅助设计与图形学学报》2024年第10期1616-1624,共9页谢志峰 郑迦恒 王吉 梁佳佳 马利庄 
上海市自然科学基金(19ZR1419100);上海市级科技重大专项(2021SHZDZX0102);上海市科技创新行动计划人工智能科技支撑项目(21511101200);上海市青年科技英才扬帆计划(22YF1420300).
语音驱动的人脸重演的目标是生成与输入语音内容相匹配的高保真人脸面部动画.然而,由于音频与视频模态之间存在鸿沟,当前方法难以实现高质量的面部重演.针对现有方法保真度低、唇音同步效果差等问题,提出一种基于结构化潜码引导隐式神...
关键词:音频驱动人脸重演 隐式神经表示 神经辐射场 跨模态 
融媒体直播与元宇宙直播结合探究
《现代电视技术》2024年第9期80-82,共3页张豫 
本文通过实际案例探讨了近年兴起的元宇宙技术与传统融媒体直播相结合的可能性,并运用语音驱动技术,以纯音频方式驱动元宇宙直播间中的虚拟主持人及嘉宾,开创了新的媒体直播形式。
关键词:元宇宙 融媒体直播 语音驱动 
HBF Talk:语音驱动的3D面部动画合成研究
《计算机科学与应用》2024年第8期168-178,共11页王文祥 王少波 智宇 陈昂 
近年来,语音驱动的3D面部动画得到了广泛的研究,虽然先前的工作可以从语音数据中生成连贯的3D面部动画,但是由于视听数据的稀缺性,生成的3D面部动画缺乏真实感和生动性,嘴唇运动的准确性不高。为了提高嘴唇运动的准确性和生动性,本文提...
关键词:Hu BERT FLASH TRANSFORMER 3D面部动画 嘴唇运动 
基于语音驱动的说话人脸视频生成综述
《电脑知识与技术》2024年第24期123-126,共4页韩家伟 游锦 
随着人工智能的快速发展,语音驱动的说话人脸生成技术因其在公共安全、医疗、电影娱乐、虚拟数字人等领域的广泛应用而受到越来越多的关注。该技术旨在根据给定的目标人脸和音频,生成自然的说话人脸视频。在过去五年中,研究人员提出了...
关键词:计算机视觉 深度学习 说话人脸生成 音频驱动 数字人 
检索报告 对象比较 聚类工具 使用帮助 返回顶部