基于多特征和SVM的文本图像版面分类方法  被引量:6

Layout Analysis Based on Multi-feature and SVM

在线阅读下载全文

作  者:程娟[1] 平西建[1] 周冠玮[1] 

机构地区:[1]解放军信息工程大学信息工程学院,郑州450002

出  处:《数据采集与处理》2008年第5期569-574,共6页Journal of Data Acquisition and Processing

摘  要:对文本图像的灰度、形状和纹理等视觉特征进行了较为全面的分析,研究了版面中文本、表格、图形和图像在各种特征层面上的差异。针对中英文版面,结合投影法与连通域分析快速准确的分割图像,提取了能够表征区域信息的17维特征向量,然后使用基于正态决策树的多分类支持向量机将文本图像版面区域分为文本、表格、图形和图像四类。实验结果表明算法能够快速、准确地处理文本图像版面,具有较强的应用价值。The gray feature,the shape feature,and the texture feature are analyzed.The differences among the text,the table,the figure,and the image on document images are studied.Aimed at the Chinese/English layout,the projection profile and the connected component analyses are effectively combined to segment images.Then,the feature vector of seventeen dimensions is abstracted for representing block information,and SVM is introduced to classify document images as four types(text,table,figure,and image).Experimental r...

关 键 词:版面分割 灰度特征 形状特征 纹理特征 支持向量机 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象