融合卷积神经网络与主题模型的图像标注  被引量:3

Image Annotation Based on Convolutional Neural Network and Topic Model

在线阅读下载全文

作  者:张蕾 蔡明[1] Zhang Lei;Cai Ming(School of Internet of Things Engineering,Jiangnan University,Wuxi,Jiangsu 214122,China)

机构地区:[1]江南大学物联网工程学院

出  处:《激光与光电子学进展》2019年第20期254-260,共7页Laser & Optoelectronics Progress

摘  要:为降低图像文本数据的稀疏性和传统图像特征的局限性,提出一种融合卷积神经网络(CNN)和主题模型的图像标注算法。利用狄利克雷主题模型对图像训练集的文本数据进行建模,生成文本主题分布和文本主题标注词分布,以降低图像文本数据的维度和稀疏性。考虑到图像文本主题的稀疏分布,利用CNN提取图像的高层视觉特征,同时改进损失函数以重构CNN。利用图像的高层视觉特征和对应的多个文本主题构建多分类器,进行图像文本主题多标签分类学习,并获得图像的文本主题分布。最后,将该文本主题分布和主题模型生成的文本主题标注词分布融合计算出图像的标注词概率。由Corel5K和IAPR TC-12图像标注数据集的对比实验可知,本文方法有效提高了图像的标注性能。To address the issue of the sparsity of image text data and the limitation of traditional image features,this study proposes an image annotation algorithm that combines a convolutional neural network(CNN)and a topic model.Herein,a Dirichlet topic model is used to model text data on image training sets and generate text topic distribution and text topic label distribution,which reduces the dimension and sparsity of image text data.Considering the sparse distribution of image text topic,the CNN is used to extract high-level visual image features,and the loss function is improved to reconstruct the CNN.Multiple classifiers are constructed based on the highlevel visual image features and corresponding multi-text topics to perform multi-label classification learning on image text topics and obtain the text-topic distribution of image.Finally,the text-topic distribution and text-topic label distribution are combined to calculate the probability of the image label.Based on the contrast experiment on Corel5Kand IAPR TC-12image annotation datasets,the proposed algorithm effectively improves the performance of image annotation.

关 键 词:图像处理 卷积神经网络 主题模型 图像标注 损失函数 多标签分类学习 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象