摘要:在网络需求增加或现有地面蜂窝基础设施故障的情况下,部署无人机(unmanned aerial vehicle,UAV)作为空中基站(aerial base stations, ABS)可为战场通信保障和蜂窝网络扩展提供灵活的解决思路。本文针对UAV-ABS为地面多用户服务时的资源分配问题,建立了更符实际的信道模型,构建了一种深度强化学习(deep reinforcement learning,DRL)模型,将决斗网络(dueling network,DN)加入到神经网络中,通过设计新颖的奖励函数,在满足服务质量(quality of service ,QoS)要求的同时,最大化了地面用户的总速率,并保证了服务公平性。仿真结果表明,相较于传统的基于数学框架和基于(deep Q-learning network,DQN)的资源分配算法,本文提出的Dueling-DQN算法可以提供更高的服务速率和服务公平性,且随着网络密度的增大,算法的优势更加明显。Dueling-DQN算法提供了一种有效的解决复杂非凸性问题的方法,可为UAV-ABS的资源分配问题提供一定的理论和方法依据。