检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]武汉大学电子信息学院,湖北武汉430072 [2]中国科学院自动化所模式识别国家重点实验室,北京100190
出 处:《华中科技大学学报(自然科学版)》2014年第3期33-36,共4页Journal of Huazhong University of Science and Technology(Natural Science Edition)
基 金:国家自然科学基金资助项目(61273269;61175021)
摘 要:提出了一种基于自适应游程平滑算法和基于改进的最小张树聚类的文本行分割算法,该算法基于图的集成聚类的框架用以进一步解决文本行分割的问题,该框架可以很容易地推广到对更多的单一算法进行融合.在该融合框架中,由对应于连通部件的顶点以及顶点对之间的边构成文档图,边上的权值由两个单一文本行分割算法的结果决定.于是,文本行分割的任务就转化为如何以最小代价对文档图进行划分的问题.该融合算法在哈尔滨工业大学多人手写数据库上取得了较好的效果,召回率为99.31%,错误率为0.94%.A graph-based clustering ensemble method combining the adaptive run-length smoothing technique with the algorithm was proposed based on minimum spanning tree clustering with distance metric learning.A weighted undirected graph was constructed with nodes corresponding to connected components and edge connecting pairs of connected components.Text line segmentation was then posed as the problems of minimum cost partitioning of the nodes in the graph such that each cluster corresponded to a unique line in the document image.Experimental results on Harbin Institute of Technology-Multiple Writers Database shows its efficiency and effectiveness with a correct detection rate of 99.31%,and an error rate of 0.94%.
关 键 词:文本行分割 自适应游程平滑 最小生成树 距离测度学习 图聚类的集成
分 类 号:TP391.43[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145