带平衡约束矩形布局优化问题的深度强化学习算法

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

摘要：带平衡约束的矩形布局问题源于卫星舱设备布局设计，属于组合优化问题。深度强化学习利用奖赏机制，通过数据训练实现高性能决策优化。针对布局优化问题，提出一种基于深度强化学习的新算法DAR及其扩展算法IDAR。DAR用指针网络输出定位顺序，再利用定位机制给出布局结果，算法的时间复杂度是O（n3）；IDAR算法在DAR的基础上引入迭代机制，算法时间复杂度是O（n4），但能给出更好的结果。（剩余12030字）

试读结束

购买全文6.00元下一篇具有激活机制的多头反向串联算术优化算法

计算机应用研究

2022年01期

¥12.00/本