检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]抚顺师范高等专科学校数理系,辽宁抚顺113006 [2]鞍山钢铁学院计算机科学与工程学院,辽宁鞍山114002
出 处:《鞍山钢铁学院学报》2002年第3期192-196,共5页Journal of Anshan Institute of Iron and Steel Technology
摘 要:总结了英文光学字符识别 (OCR)系统中的常见错误类型 ,论证了使用拼写检查技术发现错误的可能性 .以最相似单词替换OCR的错误输出 ,从而达到改正错误的目的 .利用编辑距离实现词汇相似性评估 ,并用动态规划技术优化了编辑距离的计算 .试验结果证明该方法可以使OCR系统的单词识别率提高 6 2 5 % .Putting up the type of the common errors from the system English OCR,it has proved it feasible to use a spelling check technology to find its errors.Using the most similar words to replace OCR's error output,to correct such errors,using edit distance to evaluate the similaring of words,and using dynamic planning technology to optimize the calculation of edit distance,the recognition rate of words from OCR can be improved by 6 25%.
关 键 词:英文光学字符识别 后处理 拼写检查 编辑距离 字符识别率 单词识别率
分 类 号:TP391.43[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.13