概率预测强化学习下非结构环境机械臂变阻抗力跟踪控制

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘要: 针对非结构环境下末端实时移动机械臂阻抗控制力跟踪问题,通过动态调节阻尼系数以应对接触环境的不确定性。为确保阻抗策略的高效搜索,利用机械臂与接触环境交互产生状态-动作序列构建概率预测模型(PPM)。学习过程中,机械臂仅需与非结构接触环境进行少量交互即可获得最优变阻抗策略,这使得该过程在真实机械臂上直接训练成为可能。(剩余14707字)

monitor