• 打印
  • 收藏
收藏成功
分享

基于信息熵的粗糙集属性应急数据去重挖掘算法研究


打开文本图片集

摘 要:主动学习已经被证明是一种成功的机器学习算法,最主要的缺點是它只注重样本的标签信息而忽略了样本的分布信息。因此带来的后果就是稳定性差,容易陷入局部最优解,同时对初始样本的选择非常敏感。论文将稀疏子空间聚类与主动学习相结合,首先利用稀疏子空间聚类找到原始数据的分布信息,然后利用该信息指导主动学习选取初始样本,使样本标注更加有效,提高了主动学习的效率,同时降低了主动学习对初始样本的敏感度。(剩余4411字)

网站仅支持在线阅读(不支持PDF下载),如需保存文章,可以选择【打印】保存。

畅销排行榜
monitor