基于文本挖掘和K-means聚类的航空安全事故报告的可视化分析方法  被引量:1

在线阅读下载全文

作  者:马婷[1] 

机构地区:[1]中国民用航空飞行学院计算机学院,四川广汉618307

出  处:《电脑知识与技术》2022年第35期56-59,72,共5页Computer Knowledge and Technology

基  金:国家自然科学基金项目(60472127);中国民用航空飞行学院面上项目(J2021-059)资助。

摘  要:航空事故对航空安全起到至关重要的作用,影响航空安全的因素是多重的。文章对航空安全事故报告采用文本挖掘和R语言,找出航空安全事故的致险因素,对航空安全提供参考,收集事故报告90例,首先采用了结巴分词对数据进行分词处理,其次是过滤分词结果中的停用词和无效词,然后进行关键字的提取,找出能够代表文本特征的词条,建立向量空间模型,最后采用K-means聚类算法,在K值为3时聚类效果达到最佳,将航空事故致险因素分为了人为-环境-设备三类,利用R语言的Word Cloud程序包将实验结果进行可视化处理,得出8项主要致险因素,17项一般致险因素。根据词云图中的致险因素,从人-环境-设备三个方面为以后的飞行安全提供了有价值的参考信息。

关 键 词:航空安全事故报告 文本挖掘 分词 聚类 致险因素 

分 类 号:G642[文化科学—高等教育学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象