结合PCA的tSNE算法的并行化实现方法

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘要: 为了提高大数据环境下高维非线性数据的处理速度和精确度,提出一种结合主成分分析(PCA)的基于t分布的随机近邻嵌入(tSNE)算法.首先,通过主成分分析法对原始数据进行预处理,去除噪声点;然后,结合tSNE算法,构建K最邻近(K-NN)图,以表示高维空间中数据的相似关系;最后,在Spark平台(剩余8425字)

monitor