基于统计特征的数学公式抽取方法的研究  被引量:3

Research on Mathematical Formulas Extraction from Chinese Document Based on Statistical Features

在线阅读下载全文

作  者:田学东[1] 张立平[1] 杨捧[1] 

机构地区:[1]河北大学数学与计算机学院,保定071002

出  处:《计算机工程》2006年第19期211-213,共3页Computer Engineering

基  金:河北省自然科学基金资助项目(F2004000132)

摘  要:在分析公式特征的基础上,提出了一种将Parezen窗和Bayes分类规则相结合的公式抽取方法。对于孤立式公式采用改进后的Parzen窗方法将其从文档中抽取出来,对于内嵌公式通过Bayes分类规则将其从文本行中抽取出来。实验表明,这种抽取方法对中文文档具有较好的适应性和较高的成功率。Based on the analysis of formula features, an approach composed of Parzen windows and Bayes theorem is proposed to extract mathematical formulas. Improved Parzen windows approach is used to extract the isolated formulas from the printed documents and Bayes theorem is used to extract the embedded formulas from the text lines. The experiments show that the combination of the two methods can obtain satisfactory results.

关 键 词:OCR技术 数学公式抽取 Bayes法则 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象