一种基于深度学习的档案文件齐全性检验方法  

在线阅读下载全文

作  者:肖雪丽 廖常辉 李惠仪 

机构地区:[1]广东电网有限责任公司东莞供电局,广东东莞523109

出  处:《信息记录材料》2024年第3期198-200,204,共4页Information Recording Materials

基  金:南方电网公司科技项目资助“档案归档审查智能机器人的研究与开发项目”(031900KK52220044)。

摘  要:本文针对档案管理领域中的档案文件齐全性检验任务,提出了一种基于深度学习的解决方法,旨在提高检验效率。首先,利用深度学习中的双向长短时记忆网络-条件随机场模型(bidirectional long short⁃term memory⁃conditional random field,BiLSTM⁃CRF)对档案文件名进行文本分词,以精准提取出关键词。其次,构建关键词库,并结合预设规则,形成了一种灵活且高效的档案文件齐全性检验策略。再次,通过采用句子级双向编码器的Transformer表示模型(sentence bidirectional encoder representations from transformers,SBERT),计算文本之间的相似度,进行精确的档案文件比对,以便及时发现文件是否存在缺失、重复或超出预期的情况。最后,对档案文件的齐全性进行快速、准确的评估,为档案管理人员提供有力的决策支持。

关 键 词:档案文件齐全性 深度学习 文本匹配 文本分词 

分 类 号:TP301[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象