基于大数据的分布式K-means聚类算法的研究

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘 要:如何能够使用数据挖掘方法快速对高维大规模数据进行分析和信息提取成为现今一个热门课题。基于此,本文针对当前密度峰值聚类算法的高复杂度和高计算量等问题,使用云计算框架MapReduce,研究了一种基于z值的分布式密度峰值聚类算法(DP-z)。该算法利用空间z填充曲线将高维数据集映射到一维空间上,根据数据点的z值信息对数据集进行分组。(剩余2709字)

目录
monitor