基于深度强化学习的无线资源分配算法

打开文本图片集
摘 要:为了在有限的无线资源条件下提供更高的信息传输速率,第五代移动通信(5G)引入多种高效的频谱复用技术,如终端直通技术(Device-to-Device, D2D)和非正交多址技术(Non-orthogonal Multiple Access Technology, NOMA)等。针对D2D网络,提出一种无监督的基于深度强化学习(Deep Reinforcement Learning, DRL)的信道和功率分配算法,解决了D2D用户信息传输速率最大化的问题。(剩余9477字)