图像文本

作品数:80被引量:154H指数:5
导出分析报告
相关领域:自动化与计算机技术艺术更多>>
相关作者:杨阳余正涛毛存礼高盛祥史静更多>>
相关机构:深圳市腾讯计算机系统有限公司平安科技(深圳)有限公司西安电子科技大学华中科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金教育部人文社会科学研究基金浙江省科技计划项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
图像文本:何为现实主义风格?
《世界博览》2025年第6期74-77,共4页彭李菁  
现实主义声称要表现世界(我们的世界),因此在虚构电影中,现实主义提出了一种外延性主张。但它们的主张不是建立在现实中有前因后果的关系上,而是建立在培养对那个世界的感觉上,因此也是一种表现风格,也是美学和感性的。
关键词:现实主义风格 图像文本 外延性 表现风格 前因后果 
融合双重注意力机制的缅甸语图像文本识别方法
《中文信息学报》2025年第1期47-55,共9页王奉孝 毛存礼 余正涛 高盛祥 黄于欣 刘福浩 
国家自然科学基金(61732005,U21B2027,62166023,61866019);云南省自然科学基金(2019FA023);云南省重大科技专项计划(202103AA080015,202002AD080001)。
由于缅甸语字符具有独特的语言编码结构以及字符组合规则,现有图像文本识别方法在缅甸语图像识别任务中无法充分关注文字边缘的特征,会导致缅甸语字符上下标丢失的问题。因此,该文基于Transformer框架的图像文本识别方法做出改进,提出...
关键词:缅甸语 文本识别 通道和空间注意力 特征增强 文字边缘特征 
基于语义调节与两级匹配的图像文本检索方法
《计算机技术与发展》2024年第12期100-107,共8页刘洪洲 张鸿 
国家重点研发计划(2020AAA0108503)。
图像文本检索的核心在于实现图像与文本之间的相似度匹配,其方法主要分为全局匹配和局部匹配。为了克服跨模态检索任务中全局匹配只考虑全局语义的对齐,局部匹配只考虑细粒度语义对齐,以及全局特征和局部特征交互不足的问题,该文提出一...
关键词:跨模态检索 图像文本匹配 全局匹配 局部匹配 语义调节 
基于模态内细粒度特征关系提取的图像文本检索模型
《计算机应用》2024年第12期3776-3783,共8页吴祖成 吴小俊 徐天阳 
国家自然科学基金资助项目(62020106012)。
针对跨模态检索任务中关系具有多样性,以及基于外观的传统范式无法准确反映图像中显著物体间的关联,使得它在复杂场景中的应用效果不佳的问题,提出一种基于模态内细粒度特征关系提取的图像-文本检索模型。首先,为了获得更直观的位置信息...
关键词:跨模态检索 图像文本检索 关系提取 图卷积网络 三元组损失 
基于多视角的图像文本情感分析
《计算机科学》2024年第S02期128-135,共8页高玮军 孙子博 刘书君 
国家自然科学基金(51668043)。
在社交媒体中,人们往往首先被图片中的人物表情所吸引,直接触及到情感。然而,对于情感的完整表达,场景也扮演着不可或缺的角色,为情感分析提供了必要的背景和支持。但许多学者忽视了场景在情感表达中的重要性,导致结果并非最优。针对图...
关键词:多模态 情感分析 多视角 迁移学习 注意力机制 
基于注意力网络融合的图像文本跨模态检索算法
《电视技术》2024年第11期78-81,共4页张志亮 
在计算机和人工智能领域,图像文本跨模态检索受到广泛的关注。然而,当前的图像文本跨模态检索方法往往仅粗略地融合图像文本特征信息,导致所学习的特征信息质量不高。对此,设计融合注意力网络计算的图像文本跨模态检索算法。通过训练该...
关键词:跨模态检索 图像文本特征 融合注意力网络 模型参数 
基于CHINESE-CLIP跨模态图像文本检索研究
《电子制作》2024年第22期61-66,共6页聂葳 叶成炜 杨家慧 哈雯 段班祥 桂改花 苑占江 黄海锋 
2024年广东省普通高校青年创新人才项目(编号:2024KQNCX295);基于昇腾NPU的无人机电力线路巡检图像缺陷识别算法研究及实现(编号:2021ZDZX3029);广东省继续教育质量提升工程(编号:JXJYGC2022GX111);2022年计算机视觉应用创新团队(编号:2022KCXTD047);2023年广东省普通高校青年创新人才项目(编号:2023KQNCX185);广东省普通高校特色创新项目非马氏细胞内部随机过程的建模与分析(编号:2020KTSCX238);广东省智慧职教工程技术研究中心(编号:2021A118)。
本文聚焦于多模态图像语义关联问题,采用CHINESE-CLIP模型结合迁移学习技术,探索了基于文本的图像检索和基于图像的文本检索两种方法。研究采用了CHINESE-CLIP多模态预训练神经网络,通过融合文本和图像特征提取技术,实现了文本与图像在...
关键词:CHINESE-CLIP多模态预训练神经网络 CN-CLIPViT-L/14 Vision Transformer(ViT) 
古代长颈瓶图像空间语法中的视窗、意义与符号
《包装工程》2024年第22期319-325,359,共8页彭瑶瑶 韩荣 
2021年国家社会科学基金艺术学一般项目(21BG110)。
目的长颈瓶作为古代生活器具的典型代表之一,将其图像文本作为研究对象,聚焦长颈瓶在图像中方位、重量、尺寸空间特征,以及在古代陈设空间格局变革中的媒介作用,提出针对图像空间的视觉分析模式。方法借助语言语法的认识识解功能和视觉...
关键词:长颈瓶 图像文本 空间语法 
实值无标签图文跨模态检索研究综述被引量:1
《哈尔滨工业大学学报》2024年第9期1-16,共16页张力 陈康 孙光辉 
国家重点研发计划(2020AAA0106502);国家自然科学基金(62073105);机器人技术与系统国家重点实验室开放研究项目(SKLRS-2019-KF-14,SKLRS-202003D)。
为研究面向无标签数据集基于实值特征的图像文本跨模态检索(以下简称跨模态检索)方法的发展现状和亟待解决的关键问题,对目前该领域的文献进行了分析与总结。跨模态检索是根据给定的一种模态查询,从另一种模态中检索出与查询相关的样本...
关键词:图像文本跨模态检索 多模态学习 实值特征 基于特征方法 基于分数方法 
融合风格迁移的图像文本编辑方法
《计算机辅助设计与图形学学报》2024年第9期1362-1374,共13页梁浩然 朱泽浩 梁荣华 
国家自然科学基金(62176235,62036009);浙江省自然科学基金(LY21F020026)。
为了满足非美术设计专业的普通用户能够快速地在图像上进行字符编辑,且新生成的字符尽可能地保持与相邻字符的几何和视觉一致性的要求,提出一种融合风格迁移的图像文本编辑方法.首先针对原字符颜色,迁移数据集中存在的字符颜色分布不合...
关键词:场景文本编辑 颜色迁移 数据集扩充 深度学习 视觉一致性 
检索报告 对象比较 聚类工具 使用帮助 返回顶部