英文光学字符识别的后处理  被引量:7

Postprocessing of English OCR

在线阅读下载全文

作  者:吕学强[1] 迟呈英[2] 

机构地区:[1]抚顺师范高等专科学校数理系,辽宁抚顺113006 [2]鞍山钢铁学院计算机科学与工程学院,辽宁鞍山114002

出  处:《鞍山钢铁学院学报》2002年第3期192-196,共5页Journal of Anshan Institute of Iron and Steel Technology

摘  要:总结了英文光学字符识别 (OCR)系统中的常见错误类型 ,论证了使用拼写检查技术发现错误的可能性 .以最相似单词替换OCR的错误输出 ,从而达到改正错误的目的 .利用编辑距离实现词汇相似性评估 ,并用动态规划技术优化了编辑距离的计算 .试验结果证明该方法可以使OCR系统的单词识别率提高 6 2 5 % .Putting up the type of the common errors from the system English OCR,it has proved it feasible to use a spelling check technology to find its errors.Using the most similar words to replace OCR's error output,to correct such errors,using edit distance to evaluate the similaring of words,and using dynamic planning technology to optimize the calculation of edit distance,the recognition rate of words from OCR can be improved by 6 25%.

关 键 词:英文光学字符识别 后处理 拼写检查 编辑距离 字符识别率 单词识别率 

分 类 号:TP391.43[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象