基于神经网络的印刷体数学公式抽取方法  被引量:1

Research on mathematical formulas extraction from printed document based on neural network

在线阅读下载全文

作  者:常新峰[1] 崔键[1] 刘晓蔚[2] 田学东[1] 

机构地区:[1]河北大学数学与计算机学院,河北保定071002 [2]河北大学图书馆,河北保定071002

出  处:《计算机应用研究》2008年第11期3483-3485,3500,共4页Application Research of Computers

基  金:国家自然科学基金资助项目(60772073)

摘  要:在分析中文印刷文档版式及字符特征的基础上,提出了一种将决策树与BP神经网络相结合的数学公式抽取方法。采用决策树方法将孤立公式从文档中抽取出来,采用BP神经网络方法定位内嵌公式。实验表明,该抽取方法对中文文档的公式抽取具有较高的正确率、容错率和速率。On the basis of the analysis of typographic information and character feature on printed document, an approach combining decision tree and BP neural network was proposed to extract mathematical formulas. Decision tree method was used to extract the isolated formulas lines. BP neural network was used to extract the embedded formulas from the text lines. The experiments show the methods can achieve satisfactory results.

关 键 词:光学字符识别 特征提取 数学公式抽取 决策树 BP神经网络 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象