文本内容识别技术的研究与实践  

在线阅读下载全文

作  者:李惠仪 肖雪丽 廖常辉 

机构地区:[1]广东电网有限责任公司东莞供电局,广东东莞523110

出  处:《信息记录材料》2023年第7期98-101,共4页Information Recording Materials

基  金:南方电网公司科技项目资助:档案归档审查智能机器人的研究与开发项目(031900KK52220044)。

摘  要:随着互联网、大数据、人工智能和计算机存储等技术和硬件的持续爆炸式发展,档案资源数字化和管理智能化工作也得到了快速的推动。旨在探讨如何推动档案电子化进程和解决档案电子化的困境,以便更好地满足数字化时代的需求。为此,首先,概述了过往的文本内容识别和感知中的相关技术。其次,介绍了电子档案管理应用中所面临的表格内容电子化还原识别难题。然后提出了基于U2-Net深度学习模型的表格格式提取技术,并通过融合CRNN的文字识别技术,实现了端到端的纸质表格内容的全流程解析。最后,强调了文本内容纸质档案中表格内容电子化技术的重要性,并对后续档案管理工作进行了分析和展望。

关 键 词:档案管理 深度学习 文本内容定位 文本识别 表格内容识别 

分 类 号:TP279[自动化与计算机技术—检测技术与自动化装置]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象