基于高密度近邻和确定性标记样本选择的标签传播算法

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘  要:半监督学习由于能够充分利用未标记数据而广受关注,其中图半监督学习方法具有表示直观和概念清晰的优点。然而,基于图的半监督学习方法大多需要迭代优化,且由于初始标记点的选取变化,会导致预测准确性不稳定。为了解决这一问题,提出了一种基于高密度近邻和确定性标记(high density nearest neighbors and determinate labeling, HDN-DL)的半监督分类方法,利用数据中的潜在结构和信息,选择影响力较高的节点作为标签传播的起点,通过密度峰值聚类算法(density peak clustering, DPC)得到初始的无监督聚类图结构后,将该图断开得到引领森林,再根据每个样本点的所在层次计算其高密度近邻及其相对距离,以此来综合考虑多个属性以判定当前样本的标签,避免级联误分。(剩余16128字)

monitor