检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]东华大学信息学院,上海
出 处:《计算机科学与应用》2025年第2期23-32,共10页Computer Science and Application
摘 要:本文聚焦于图像检索中的长尾分布问题,提出了一种基于数据增强的深度哈希检索框架。传统图像检索技术多依赖人工或自动标注,但由于文本描述与图像存在语义鸿沟,加之数据量的不断增长,检索效率和成本成为主要瓶颈。深度哈希技术通过深度神经网络自动提取图像特征并映射到二进制哈希码空间,显著提高了检索效率。然而,实际数据中长尾分布的普遍存在导致深度哈希模型对尾部类别表现较差,尤其在大规模、不平衡数据集上难以达到理想效果。为解决上述问题,本文引入扩散模型这一生成技术,通过生成尾部类别样本来丰富数据多样性,从而缓解数据分布不均的影响,增强模型对尾部类别的识别能力。同时,结合AttnDreamBooth微调技术,优化合成数据生成的质量,将其与深度哈希技术相结合,对东华大学丝绸数据集进行实验,取得了显著的性能提升。通过从数据层面平衡分布并在模型层面强化训练,本文提出的方法有效应对了长尾分布对深度哈希检索的负面影响,为图像检索领域提供了新思路与实践方向。This paper focuses on the long-tail distribution problem in image retrieval and proposes a deep hashing retrieval framework based on data augmentation. Traditional image retrieval techniques often rely on manual or automatic annotation;however, the semantic gap between textual descriptions and images, coupled with the continuous growth of data volume, has made retrieval efficiency and cost major bottlenecks. Deep hashing technology leverages deep neural networks to automatically extract image features and map them into binary hash code space, significantly improving retrieval efficiency. Nevertheless, the widespread presence of long-tail distributions in real-world data leads to poor performance of deep hashing models on tail classes, especially on large-scale, imbalanced datasets. To address this issue, this paper introduces diffusion models
关 键 词:长尾分布 哈希检索 丝绸数据集 数据增强 扩散模型
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.116.118.216