云南高校图书馆联盟文献共享服务平台- 图像文本

图像文本: 作品数：81被引量：154H指数：5; 导出分析报告; 相关领域：自动化与计算机技术艺术更多>>; 相关作者：杨阳余正涛毛存礼高盛祥史静更多>>; 相关机构：深圳市腾讯计算机系统有限公司平安科技(深圳)有限公司西安电子科技大学电子科技大学更多>>; 相关期刊：更多>>; 相关基金：国家自然科学基金国家社会科学基金教育部人文社会科学研究基金浙江省科技计划项目更多>>

基于python对图像文本检测定位识别方法研究: 《信息系统工程》2025年第4期47-50,共4页吴金聪朱大洲屠振华; 农业农村部重大信息化平台运维专项“食物营养信息管理咨询平台运维”(项目编号:102125191610420009001);中国农业科学院基本科研业务费专项院级统筹项目“食物营养健康科普信息监测与创作模式研究”(项目编号:Y2024XK11)。; 在自然场景中,文本的形态、颜色、大小以及排列方式各不相同,加之复杂的背景干扰,传统的文本检测方法往往难以取得理想的效果。与传统Faster-CNN相比,TLDN与TRN混合模型设计得更轻量,实时实现快速跟踪。TLDN(Text Location Detection Ne...; 关键词：卷积神经网络循环神经网络文本识别

图像文本:何为现实主义风格?: 《世界博览》2025年第6期74-77,共4页彭李菁无; 现实主义声称要表现世界(我们的世界),因此在虚构电影中,现实主义提出了一种外延性主张。但它们的主张不是建立在现实中有前因后果的关系上,而是建立在培养对那个世界的感觉上,因此也是一种表现风格,也是美学和感性的。; 关键词：现实主义风格图像文本外延性表现风格前因后果

融合双重注意力机制的缅甸语图像文本识别方法: 《中文信息学报》2025年第1期47-55,共9页王奉孝毛存礼余正涛高盛祥黄于欣刘福浩; 国家自然科学基金(61732005,U21B2027,62166023,61866019);云南省自然科学基金(2019FA023);云南省重大科技专项计划(202103AA080015,202002AD080001)。; 由于缅甸语字符具有独特的语言编码结构以及字符组合规则,现有图像文本识别方法在缅甸语图像识别任务中无法充分关注文字边缘的特征,会导致缅甸语字符上下标丢失的问题。因此,该文基于Transformer框架的图像文本识别方法做出改进,提出...; 关键词：缅甸语文本识别通道和空间注意力特征增强文字边缘特征

基于语义调节与两级匹配的图像文本检索方法: 《计算机技术与发展》2024年第12期100-107,共8页刘洪洲张鸿; 国家重点研发计划(2020AAA0108503)。; 图像文本检索的核心在于实现图像与文本之间的相似度匹配,其方法主要分为全局匹配和局部匹配。为了克服跨模态检索任务中全局匹配只考虑全局语义的对齐,局部匹配只考虑细粒度语义对齐,以及全局特征和局部特征交互不足的问题,该文提出一...; 关键词：跨模态检索图像文本匹配全局匹配局部匹配语义调节

基于模态内细粒度特征关系提取的图像文本检索模型: 《计算机应用》2024年第12期3776-3783,共8页吴祖成吴小俊徐天阳; 国家自然科学基金资助项目(62020106012)。; 针对跨模态检索任务中关系具有多样性,以及基于外观的传统范式无法准确反映图像中显著物体间的关联,使得它在复杂场景中的应用效果不佳的问题,提出一种基于模态内细粒度特征关系提取的图像-文本检索模型。首先,为了获得更直观的位置信息...; 关键词：跨模态检索图像文本检索关系提取图卷积网络三元组损失

基于多视角的图像文本情感分析: 《计算机科学》2024年第S02期128-135,共8页高玮军孙子博刘书君; 国家自然科学基金(51668043)。; 在社交媒体中,人们往往首先被图片中的人物表情所吸引,直接触及到情感。然而,对于情感的完整表达,场景也扮演着不可或缺的角色,为情感分析提供了必要的背景和支持。但许多学者忽视了场景在情感表达中的重要性,导致结果并非最优。针对图...; 关键词：多模态情感分析多视角迁移学习注意力机制

基于注意力网络融合的图像文本跨模态检索算法: 《电视技术》2024年第11期78-81,共4页张志亮; 在计算机和人工智能领域,图像文本跨模态检索受到广泛的关注。然而,当前的图像文本跨模态检索方法往往仅粗略地融合图像文本特征信息,导致所学习的特征信息质量不高。对此,设计融合注意力网络计算的图像文本跨模态检索算法。通过训练该...; 关键词：跨模态检索图像文本特征融合注意力网络模型参数

基于CHINESE-CLIP跨模态图像文本检索研究: 《电子制作》2024年第22期61-66,共6页聂葳叶成炜杨家慧哈雯段班祥桂改花苑占江黄海锋; 2024年广东省普通高校青年创新人才项目(编号:2024KQNCX295);基于昇腾NPU的无人机电力线路巡检图像缺陷识别算法研究及实现(编号:2021ZDZX3029);广东省继续教育质量提升工程(编号:JXJYGC2022GX111);2022年计算机视觉应用创新团队(编号:2022KCXTD047);2023年广东省普通高校青年创新人才项目(编号:2023KQNCX185);广东省普通高校特色创新项目非马氏细胞内部随机过程的建模与分析(编号:2020KTSCX238);广东省智慧职教工程技术研究中心(编号:2021A118)。; 本文聚焦于多模态图像语义关联问题,采用CHINESE-CLIP模型结合迁移学习技术,探索了基于文本的图像检索和基于图像的文本检索两种方法。研究采用了CHINESE-CLIP多模态预训练神经网络,通过融合文本和图像特征提取技术,实现了文本与图像在...; 关键词：CHINESE-CLIP多模态预训练神经网络 CN-CLIPViT-L/14 Vision Transformer(ViT)

古代长颈瓶图像空间语法中的视窗、意义与符号: 《包装工程》2024年第22期319-325,359,共8页彭瑶瑶韩荣; 2021年国家社会科学基金艺术学一般项目(21BG110)。; 目的长颈瓶作为古代生活器具的典型代表之一,将其图像文本作为研究对象,聚焦长颈瓶在图像中方位、重量、尺寸空间特征,以及在古代陈设空间格局变革中的媒介作用,提出针对图像空间的视觉分析模式。方法借助语言语法的认识识解功能和视觉...; 关键词：长颈瓶图像文本空间语法

实值无标签图文跨模态检索研究综述被引量：1: 《哈尔滨工业大学学报》2024年第9期1-16,共16页张力陈康孙光辉; 国家重点研发计划(2020AAA0106502);国家自然科学基金(62073105);机器人技术与系统国家重点实验室开放研究项目(SKLRS-2019-KF-14,SKLRS-202003D)。; 为研究面向无标签数据集基于实值特征的图像文本跨模态检索(以下简称跨模态检索)方法的发展现状和亟待解决的关键问题,对目前该领域的文献进行了分析与总结。跨模态检索是根据给定的一种模态查询,从另一种模态中检索出与查询相关的样本...; 关键词：图像文本跨模态检索多模态学习实值特征基于特征方法基于分数方法

图像文本