基于目标的域随机化方法在机器人操作方面的研究

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘要:使用强化学习解决机器人操作问题有着诸多优势,然而传统的强化学习算法面临着奖励稀疏的困难,且得到的策略难以直接应用到现实环境中。为了提高策略从仿真到现实迁移的成功率,提出了基于目标的域随机化方法。使用基于目标的强化学习算法对模型进行训练,可以有效地应对机器人操作任务奖励稀疏的情况,得到的策略可以在仿真环境下良好运行。(剩余15860字)

目录
monitor