基于OCR及组合标签索引模板的电力铭牌信息提取方法  

在线阅读下载全文

作  者:习毅聪 孙坳 石凯丞 胡亮 刘浩 

机构地区:[1]国网北京市电力公司物资分公司,北京100054 [2]武汉科技大学机械自动化学院,湖北武汉430081

出  处:《电脑知识与技术》2024年第31期109-111,124,共4页Computer Knowledge and Technology

摘  要:电力设备铭牌结构复杂、传统OCR难以有效地结构化提取铭牌信息,而传统的模板匹配方法存在模板管理困难等问题,针对该问题,提出了一种基于OCR及组合标签索引模板的电力铭牌信息结构化提取方法。该方法首先依据铭牌文本结构特性,将其分为常规型与特殊型两类。对于特殊型铭牌,构建模板库并为所有模板注明标签。利用标签检索对应模板进行匹配,从而提取结构化信息。对于常规型铭牌,则采用内置结构化信息处理规则的OCR引擎直接提取结构化信息。实验结果表明,该方法能够准确高效地提取常规型与特殊型铭牌的结构化数据,有效提高了电力铭牌信息提取的效率。

关 键 词:电力铭牌识别 OCR识别 结构化信息提取 模板匹配 模板检索 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象