小样本不平衡设备数据下的机器学习策略研究

打开文本图片集
摘要:针对小样本数据样本容量不足与分布不平衡的设备寿命预测问题,构建基于改进SMOTE 算法与改进 KNN(K-NearestNeighbor) 算法联合优化模型。首先,设置噪声比例系数β排除样本数据中的噪声,随后通过类 B-SMOTE(Borderline-SMOTE) 算法与传统 SOMTE 算法结合构建改进 SMOTE(ISMOTE)算法对存在分布问题的少数类样本进行新增优化,避免因为样本分布不平衡以及样本数量较少引起的偏差。(剩余13767字)