求解外卖配送问题的深度强化学习算法

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘 要:以最小化骑手费用效益比为优化目标,采用最小比率旅行商问题对外卖配送问题进行建模。针对目前算法在求解该问题时计算精度低、算法稳定性差等问题,设计一种基于深度强化学习的DRL-MFA算法。首先,定义外卖配送问题的马尔可夫决策模型来模拟智能体与环境的交互过程;其次,在编码阶段设计多特征聚合嵌入子层,实现特征间的优势互补并提高模型对非线性问题的建模能力;最后,在解码阶段通过注意力机制和指针网络计算解的概率分布,采用策略梯度算法对网络模型进行训练。(剩余21550字)

目录
monitor