基于组件的中文版面分析  被引量:5

A Chinese Document Layout Analysis Method Based on Component

在线阅读下载全文

作  者:刘定强[1] 张炘中 

机构地区:[1]北京信息工程学院研究生科,北京100101

出  处:《中文信息学报》2000年第2期8-13,共6页Journal of Chinese Information Processing

基  金:国家自然科学基金资助!(合同号 :6 94 330 10 )

摘  要:本文提出基于组件的中文版面分析方法。本方法是以自底向上为主 ,同时结合了自顶向下和基于组件的思想。基于组件的思想使得算法结构清晰、图象扫描次数被尽可能地减少 ;以自底向上为主、同时结合自顶向下的方法具有效率高、准确性高、文档适应性广的特点。二维有序树型结构的文档及其组件的组织形式 ,提高了频繁的查找操作速度 ,同时为版面描述和分析结果的应用提供了方便。This paper presents a methord for Chinese document layout analysis based on component. This methord mostly bases on a bottom up approach,it also benefits from a top down approach and a concept of component.The concept of component lets the methord have a clear structure and reduces the times of scanning picture.Union the bottom up approach and the top down approach lets the methord have a high efficiency,precision and adaptability.We use a two dimensional orderly tree structure to organize document and comoponents.It improves the seaching speed and gives a convenience for application and document description.

关 键 词:版面分析 自底向上 组件 汉字识别 OCR技术 

分 类 号:H123[语言文字—汉语] TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象