检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨昌其[1] 姜美岑 林灵[1] YANG Chang-qi;JIANG Mei-cen;LIN Ling(Civil Aviation Flight University of China,Guanghan 618000,China)
出 处:《航空计算技术》2024年第4期89-93,共5页Aeronautical Computing Technique
基 金:中国民用航空局空中交通管理局横向科研项目资助(H2023-100)。
摘 要:由于危险源与安全隐患在民航安全管理工作中容易出现概念混淆和记录混乱的情况,根据双重预防机制管理规定,需要将两者区分开来。通过在ASIS系统上采集得到空管危险源控制清单作为研究对象,并对其进行相应的文本数据挖掘工作。根据危险源与安全隐患特点构建相应的文本分类模型:首先通过文本清洗、去停用词、Jieba分词等对空管危险源控制清单进行预处理,然后基于BERT模型生成词向量,采用BERT-Base-Chinese预训练模型进行预训练,并对模型进行微调超参数,最后结合Softmax分类器得到分类结果。As hazardous sources and safety hazards are prone to conceptual confusion and record confusion in civil aviation safety management,it is necessary to distinguish the two according to the management regulations of the dual prevention mechanism.The control list of ATC hazardous sources is collected on ASIS system as the research object of this paper,and the corresponding text data mining work is carried out on it.The corresponding text classification model is constructed according to the characteristics of hazardous sources and safety hazards:firstly,the ATC hazardous source control list is preprocessed by text cleaning,de-duplication,Jieba split,etc.,and then the word vectors are generated based on the BERT model,and the pre-training model is pre-trained using the BERT-Base-Chinese pre-training model with fine-tuning of hyper-parameters,and finally,the classification is combined with a Softmax classifier to get the classification results.
关 键 词:文本分类 数据挖掘 BERT模型 危险源 安全隐患
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:13.59.173.30