面向不平衡数据分类的DPC-SMOTE过采样算法

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘 要:针对不平衡数据集中存在的噪声以及类内类间不平衡问题,提出了基于密度峰值聚类过采样算法。首先对多数类样本进行预处理,筛选噪声样本并删除;其次,对所有少数类样本采用密度峰值聚类,剔除噪声点;再次,根据聚类后每个簇不同的稀疏度分配采样权重,并计算每个簇需要合成的新样本数目;最后在每个簇内进行SMOTE过采样合成新样本。(剩余20029字)

monitor