基于高斯混合模型的分布式强化学习算法鲁棒性优化

  • 打印
  • 收藏
收藏成功

摘 要:当前,分布式强化学习假设所有智能体均能正常工作,但在实际情况中可能存在异常智能体。为此,提出了一种基于高斯混合模型的聚类方法,用于优化分布式强化学习算法。首先,计算智能体上传梯度对应的高斯分布概率。其次,根据高斯分布更新聚类模型参数,并重复执行上述步骤直至收敛。最后,根据聚类模型筛选异常梯度。(剩余6969字)

试读结束

monitor