基于双Q学习算法的安全容量的优化

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘  要: 由于无线传播的广播和开放性,车联网通信系统易遭受到窃听者的窃听,这降低了通信系统的安全容量。为此,文中提出基于深度强化学习的安全容量的优化算法(D3QN⁃RS)。利用随机过程理论将最优转发节点的选举问题转化为马尔可夫决策过程(MDP),并将截获概率融入奖励函数。利用奖励值抑制截获概率,并将选择转发节点的问题转入强化学习框架。(剩余10933字)

试读结束

monitor