基于深度强化学习的电子政务云动态化任务调度方法

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

摘要：电子政务云中心的任务调度一直是个复杂的问题。大多数现有的任务调度方法依赖于专家知识，通用性不强，无法处理动态的云环境，通常会导致云中心的资源利用率降低和服务质量下降，任务的完工时间变长。为此，提出了一种基于演员评论家（actor-critic，A2C）算法的深度强化学习调度方法。首先，actor网络参数化策略根据当前系统状态选择调度动作，同时critic网络对当前系统状态给出评分；然后，使用梯度上升的方式来更新actor策略网络，其中使用了critic网络的评分来计算动作的优劣；最后，使用了两个真实的业务数据集进行模拟实验。（剩余18575字）

试读结束

购买全文6.00元下一篇快速视频去雾改进算法的FPGA实现

计算机应用研究

2024年06期

¥12.00/本