一种手写图文分离方法  被引量:1

A Method of Handwriting Texts and Shapes Separation

在线阅读下载全文

作  者:胡兴鸿[1,2] 施大鹏[1,2] 冯桂焕[1,2] 

机构地区:[1]计算机软件新技术国家重点实验室,江苏南京210093 [2]南京大学软件学院,江苏南京210093

出  处:《计算机与现代化》2013年第12期145-148,154,共5页Computer and Modernization

基  金:国家自然科学基金资助项目(61100109)

摘  要:手写识别作为改善人机交互的技术之一已经变得越来越重要,涌现了大量对手写文字和手绘图形的研究工作,而作为手写识别的一个重要部分,对图形和文本的分类工作一直没有获得足够的重视。本文基于开源数据挖掘工具Weka设计并实现一种手写图文分离方法,基于LogitBoost、Random Forest和LADTree三种不同分类器的测试结果表明,LogitBoost的综合分类效果最好。通过联合3个分类器能够实现精确的图形判定,但文本的分类效率则受限于分类效果最差的分类器。同时基于信息增益评估结果,分析了不同特征对图文分类的影响。As a technology to improve human-computer interaction , handwriting recognition is becoming more and more impor-tant.However, the distinction of handwriting texts and shapes has not drawn enough attention .In this paper, we designed and implemented a handwriting text and shape separation approach based on Weka .The experiment results based on three classifica-tion techniques , LogitBoost , RandomForest and LogitBoost , show that LogitBoost performances best .Through a combination of these three classifiers , shapes can be recognized more accurately , while the precision of text is limited by the classifier with lowest accuracy.Moreover, the effect of different features to the results is analyzed based on Information Gain Method .

关 键 词:手写识别 数据挖掘 图文分离 分类模型 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象