海蓝目录自动识别系统的设计  被引量:1

Design of Highland Catalog Auto-Recognition System

在线阅读下载全文

作  者:梁莹[1] 施善旦[1] 

机构地区:[1]广西计算中心,广西南宁530022

出  处:《广西科学院学报》2004年第4期284-286,共3页Journal of Guangxi Academy of Sciences

摘  要:设计海蓝目录自动识别系统。该系统在获取已预处理过的目录图像之后 ,对图像进行版面分析 ,利用OCR技术识别文字 ,并自适应地获取目录的缩进量作为判断目录层次的依据 ,最后通过目录提取和人工校正得到统一的目录格式。该系统具有自动识别、提取书籍目录结构等功能 ,能有效地处理多种格式的书籍目录类型。Highland catalog auto-recognition system is proposed,which can handle various styles of catalog images, and its key technical characteristics are described.This system firstly analyzes the content of the catalog in the preprocessed images,then uses OCR technique to recognize the characters,then exploits the relative indent to get the hierarchical structure of the catalog,which is corrected manually to get the unified catalog format.

关 键 词:目录识别 OCR 版面分析 缩进量 目录提取 人工校正 目录格式 

分 类 号:G254.364[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象