基于朴素贝叶斯模型和PageRank算法的电网事故主题爬虫算法

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘 要:为了减少电网人身安全事故,利用数据挖掘技术构建和分析事故多维数据,建立准确的预警模型十分必要.其中一个极具挑战性的问题是如何在海量网页中自动化采集人身事故样本数据.提出一种朴素贝叶斯模型与PageRank结合的主题爬虫算法.首先采用中文文本分割和设置关键词词频的方法对数据预处理,进行特征选择(剩余12197字)

monitor