基于层级匹配的维吾尔文关键词文档图像检索  被引量:4

Uyghur keywords document image retrieval based on hierarchical matching

在线阅读下载全文

作  者:李静静 木特力甫·马木提 吾尔尼沙·买买提 阿力木江·艾沙[3] 库尔班·吾布力[1] LI Jing-jing;Mutelep·Mamut;Hornisa·Mamat;Alim·Aysa;Kurban·Ubul(College of Information Science and Engineering,Xinjiang University,Urumqi 830046,China;Library,Xinjiang University,Urumqi 830046,China;Teachers’Department,Xinjiang University,Urumqi 830046,China)

机构地区:[1]新疆大学信息科学与工程学院,新疆乌鲁木齐830046 [2]新疆大学图书馆,新疆乌鲁木齐830046 [3]新疆大学教师工作部,新疆乌鲁木齐830046

出  处:《计算机工程与设计》2020年第4期1062-1069,共8页Computer Engineering and Design

基  金:国家自然科学基金项目(61563052、61862021、61363064);新疆大学2018年度博士启动基金项目(62008040)。

摘  要:为实现基于关键词的维吾尔文文档图像检索,提出一种基于由粗到细层级匹配的关键词文档图像检索方法。使用改进的投影切分法将经过预处理的文档图像切分成单词图像库,使用模板匹配对关键词进行粗匹配;在粗匹配的基础上,提取单词图像的方向梯度直方图(HOG)特征向量;通过支持向量机(SVM)分类器学习特征向量,实现关键词图像检索。在包含108张文档图像的数据库中进行实验,实验结果表明,检索准确率平均值为91.14%,召回率平均值为79.31%,该方法能有效实现基于关键词的维吾尔文文档图像检索。To realize keywords based information retrieval system for Uyghur document images,a keywords document image retrieval method based on coarse-fine level matching was proposed.The preprocessed document images were segmented into word image library using the improved projection segmentation method,and the keywords were roughly matched by template matching.On the basis of rough matching,feature vectors of directional gradient histogram(HOG)of word images were extracted.Keywords image retrieval was realized by learning feature vectors with support vector machine(SVM)classifier.Experiments were carried out on a database containing 108 document images.The average retrieval accuracy and recall rate are 91.14%and 79.31%respectively.The results show that the proposed method can effectively realize image retrieval of Uyghur documents based on keywords.

关 键 词:文档图像检索 层级匹配 模板匹配 HOG特征 支持向量机 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象