基于文本挖掘和K-means聚类的航空安全事故报告的可视化分析方法

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘要: 航空事故对航空安全起到至关重要的作用,影响航空安全的因素是多重的。文章对航空安全事故报告采用文本挖掘和R语言,找出航空安全事故的致险因素,对航空安全提供参考,收集事故报告90例,首先采用了结巴分词对数据进行分词处理,其次是过滤分词结果中的停用词和无效词,然后进行关键字的提取,找出能够代表文本特征的词条,建立向量空间模型,最后采用K-means聚类算法,在K值为3时聚类效果达到最佳,将航空事故致险因素分为了人为-环境-设备三类,利用R语言的Word Cloud程序包将实验结果进行可视化处理,得出8项主要致险因素,17项一般致险因素。(剩余6411字)

目录
monitor
客服机器人