一种改进密度峰值聚类的欠采样算法

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

摘要：不平衡数据越来越多地出现在各个领域，而传统机器学习分类算法往往会忽略少数类样本的分类精度，针对此问题，提出一种基于密度峰值聚类改进的欠采样算法。该算法利用信息熵对密度峰值聚类算法进行优化，获取最优截断距离；选取密度距离较大的点作为聚类中心并选取所有聚类中心代表整个多数类数据集。将该文算法与几种欠采样算法进行对比实验，结果表明，该方法有效提高了不平衡数据集中少数类的预测精度。（剩余7683字）

试读结束

购买全文5.00元下一篇基于VMD-EMD-LSTM的日前电价预测

现代信息科技

2022年18期

¥18.00/本