视频描述

作品数:55被引量:77H指数:5
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:蔡晓东王瀚漓刘斌张玥杰汤鹏杰更多>>
相关机构:电子科技大学深圳市腾讯计算机系统有限公司杭州电子科技大学桂林电子科技大学更多>>
相关期刊:《计算机工程与设计》《中华创伤骨科杂志》《光学精密工程》《软件导刊》更多>>
相关基金:国家自然科学基金中国博士后科学基金陕西省自然科学基金辽宁省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于有序记忆网络的视频描述
《软件导刊》2025年第4期154-163,共10页胡一康 杨莉 陈淑琴 巫世峰 
湖北省教育科学规划专项资助重点课题(光谷教师教育综合改革实验区专项)(2022ZA41);湖北省自然科学基金项目(2023AFB206);湖北第二师范学院人才引进科研启动经费项目(ESRC20230009);交通物联网技术湖北省重点实验室开放基金项目(WHUTIOT2023-006)。
针对目前基于长短时记忆网络(LSTM)的视频描述模型忽视了生成的文本前后有关联逻辑问题,以及训练时的单词级交叉熵损失优化与句子级别的评价指标不能很好地匹配等问题,提出一个结合双向长短期记忆网络(BiLSTM)和有序记忆网络(ONLSTM)的...
关键词:视频描述 有序记忆网络 双向长短期记忆网络 注意力机制 深度学习 
基于CLIP的多模态融合视频描述生成
《计算机工程与设计》2025年第2期384-391,共8页王亮 夏舟勇 胡营营 王军 
国家外国专家项目计划基金项目(G2022006008L);中国高校产学研创新基金项目(2021LD06009);辽宁省自然科学基金项目(2022-MS-291);辽宁省教育厅科研基金项目(LJ2020024);辽宁省教育厅基本科研基金项目(LJKMZ20220781);辽宁省教育厅基本科研面上基金项目(JYTMS20231488)。
为解决视频描述任务中2D的CLIP预训练模型缺乏时序关系与动作检测敏感性以及信息冗余问题,提出一种基于CLIP的结合注意力掩码与运动表示增强的多模态融合视频描述模型。采用可学习令牌整理冻结的CLIP特征、运动特征与音频特征中的关键信...
关键词:预训练模型 视频描述 多模态 特征融合 运动表示 注意力掩码 关键词检测 
基于知识蒸馏的视频描述轻量化模型及性能优化
《无线电工程》2024年第11期2547-2557,共11页陈凯 唐振华 崔振雷 李健泽 
国家自然科学基金(62171145);广西自然科学基金面上项目(2021GXNSFAA220058)。
视频描述生成是利用计算机视觉和自然语言处理技术将视频内容转化为文字描述的过程,具有广泛的应用场景,包括信号识别与解码、网络视频会议、视频监控和安防、视频翻译和内容检索等。基于深度学习的视频描述生成模型在性能方面取得了显...
关键词:视频描述生成 模型压缩 轻量化 知识蒸馏 预训练模型 
改进的密集视频描述Transformer译码算法
《计算机工程与应用》2024年第17期89-97,共9页杨大伟 盘晓芳 毛琳 张汝波 
国家自然科学基金(61673084);辽宁省自然科学基金(20180550866,2020-MZLH-24)。
当Transformer应用于密集视频描述时,历史文本特征会对后续文本生成产生干扰,难以捕捉视频动态信息从而影响描述的连贯性和准确性。为保持上下文一致性的同时又能缓解历史文本干扰,提出改进的密集视频描述Transformer译码算法(D-Uformer...
关键词:密集视频描述 Transformer网络 译码 前馈神经网络 跳跃连接 
融合语义信息和视觉推理特征的视频描述方法
《小型微型计算机系统》2024年第2期470-476,共7页张浩萌 刘斌 
国家自然科学基金项目(61672279)资助。
视频描述是一项同时涉及到计算机视觉和自然语言处理两个领域的跨模态任务,其目的是为视频自动生成一段描述,所生成的内容不仅要准确完整地描述视频的主要内容,而且要符合基本的语法结构.针对现有的视频描述方法在生成过程的可解释性和...
关键词:视频描述 特征融合 视觉推理特征 语义特征 
基于双向特征金字塔的密集视频描述生成方法
《中国科技论文》2024年第2期200-208,共9页张煜杨 刘茂福 
针对当前方法普遍存在较为严重的细节结构信息丢失与事件间重叠的问题,提出一种基于双向特征金字塔的密集视频描述生成方法(dense video captioning with bilateral feature pyramid net,BFPVC)。BFPVC通过带有自底向上、自顶向下、横...
关键词:密集视频描述 视频描述 视频理解 特征金字塔 自然语言处理 
基于事件最大边界的密集视频描述方法
《中国科技论文》2024年第2期169-177,共9页陈劭武 胡慧君 刘茂福 
针对基于集合预测的密集视频描述方法由于缺乏显式的事件间特征交互且未针对事件间差异训练模型而导致的模型重复预测事件或生成语句雷同问题,提出一种基于事件最大边界的密集视频描述(dense video captioning based on event maximal m...
关键词:密集视频描述 多任务学习 端到端模型 集合预测 
基于潜在特征增强网络的视频描述生成方法被引量:2
《计算机工程》2024年第2期266-272,共7页李伟健 胡慧君 
国家自然科学基金(62271359)。
视频描述生成旨在用自然语言描述视频中的物体及其相互作用。现有方法未充分利用视频中的时空语义信息,限制了模型生成准确描述语句的能力。为此,提出一种用于视频描述生成的潜在特征增强网络(LFAN)模型。利用不同的特征提取器提取外观...
关键词:视频描述生成 潜在特征增强网络 时空语义信息 图神经网络 特征融合 
基于增强全局-局部特征融合的视频描述生成方法被引量:1
《国外电子测量技术》2024年第1期1-9,共9页黄飞燕 曾上游 邱泓语 
国家自然科学基金(61976063)项目资助。
现有的视频描述生成方法提取的特征及特征组合的方式较为简单,导致模型丢失了部分与视频描述相关的重要语义信息,限制了对视频内容的准确描述和理解。分析存在的不足,提出了一种基于增强全局-局部特征融合的视频描述生成方法。首先采用...
关键词:视频描述生成 增强特征融合网络 自然语言处理 
密集视频描述的软组织肿瘤切除手术记录自动生成系统的研发与临床应用
《中华创伤骨科杂志》2024年第1期43-49,共7页王小荷 刘浩敏 程德斌 党竞医 李睿敏 缑水平 付军 范宏斌 
陕西省自然科学基金项目(2022SF-054);西京医院2021年学科助推计划项目(XJZT21CM32);国家自然科学基金(62102296);西京医院2023年医务人员技术提升项目(2023XJSM12)。
目的探讨密集视频描述的自动化良性软组织肿瘤切除术手术记录生成方法及应用价值。方法应用Transformer深度学习模型建立自动化手术记录生成系统,回顾性分析2021年9月至2023年8月空军军医大学西京医院骨科收治的30例良性软组织肿瘤患者...
关键词:软组织肿瘤 人工智能 手术室信息系统 深度学习 手术记录生成 
检索报告 对象比较 聚类工具 使用帮助 返回顶部