基于本体驱动的航空情报表格信息结构化研究  

Ontology-driven Study on Information Structuring of Aeronautical Information Tables

在线阅读下载全文

作  者:赖欣 李思宁 梁昌盛 张恒嫣 LAI Xin;LI Sining;LIANG Changsheng;ZHANG Hengyan(Civil Aviation Flight University of China,Guanghan,Sichuan 618307,China)

机构地区:[1]中国民用航空飞行学院,四川广汉618307

出  处:《计算机科学》2024年第S01期693-699,共7页Computer Science

基  金:四川省自然科学基金(2023NSFSC0903);中央高校校级重点项目(ZJ2023-003)。

摘  要:航空资料汇编是国际民航组织推荐的呈现各国航空信息的主要载体,其中以表格数据形式汇总了大量航空数据与航空运行限制信息。为实现航空汇编资料的智能查询,以及对航空资料汇编中静态数据的挖掘与利用,需要对航空汇编资料中的表格信息予以特征提取与结构化处理。将航空资料汇编中表格信息作为研究对象,提出了一种基于本体驱动的航空情报表格信息结构化抽取方法。首先构建航空情报领域信息的本体框架,实现对领域知识统一规范的描述;其次,利用Document AI对表格文档的布局结构进行研究与预处理,并利用随机森林算法与条件随机场模型进行特征实体提取验证与分析。实验结果表明,所提方法能够有效提取航空情报表格中的特征实体,为航空情报领域静态数据深入挖掘提供参考。The aeronautical information publication(AIP)is the main carrier recommended by ICAO to present aeronautical information of all countries,in which a large amount of aeronautical data and aeronautical operation restriction information exists in the form of table information.In order to achieve intelligent querying of AIP and to facilitate the extraction and utilization of static data within it,it is necessary to perform feature extraction and structural processing on the tabular information within AIP.In this paper,an ontology-driven structured extraction method for aeronautical information tabular data is proposed,taking tabular data in AIP as the research object.Firstly,the ontology framework of aeronautical information is constructed to realize a unified and standardized description of domain knowledge.Secondly,the layout structure of form documents is studied and preprocessed using Document AI,and the feature entity extraction is verified and analyzed using random forest algorithm and conditional random field model(CRF).Experimental results show that the proposed method can effectively extract the feature entities in AIP,and provide reference for the in-depth mining of static data in the field of aeronautical information.

关 键 词:航空情报 本体 命名实体识别 条件随机场 随机森林 Document AI 

分 类 号:TP391[自动化与计算机技术—计算机应用技术] V355[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象