检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:吴官翰 赵建伟 高飞飞[2] WU Guanhan;ZHAO Jianwei;GAO Feifei(Rocket Force University of Engineering,Xi’an 710038,China;Tsinghua University,Beijing 100084,China)
机构地区:[1]火箭军工程大学,中国西安710038 [2]清华大学自动化系,中国北京100084
出 处:《中兴通讯技术》2021年第2期31-36,共6页ZTE Technology Journal
摘 要:空天地一体化网络是未来6G的关键内容。结合高精度波束赋形,无人机(UAV)的视距链路(LoS)可很好地作为空天地一体化网络的补充,但地面用户与基站间的相对运动极易造成信道容量失衡。提出一种噪声深度确定性策略梯度(Noisy-DDPG)方法。该方法以最大化通信公平性和系统容量为目标,利用DDPG优化分配方案,通过调整奖励函数策略参数来实现公平性和信道容量的平衡;通过在策略网络中利用可学习参数噪声进行扰动,得到更合理的分配方案。仿真实验验证了该算法的有效性。The space-air-ground integrated network is an important part of the future 6G,which can be well complemented by the unmanned aerial vehicle’s(UAV)line-of-sight(LoS)link combined with high-precision beamforming.However,the random channel characteristics of mobile users can easily cause channel capacity imbalance.In this paper,the Noisy-Deep Deterministic Policy Gradient(Noisy-DDPG)is proposed.To maximize communication fairness and system capacity,the Deep Deterministic Policy Gradient(DDPG)is used to optimize the allocation strategy.Besides,fairness and channel capacity are differently emphasized by adjusting the reward function policy parameters.Moreover,the learnable parameter noise is used to disturb the policy network to obtain a more reasonable allocation plan.Finally,various simulation results to verify the effectiveness of the algorithm are proposed.
关 键 词:无人机基站 资源调度 DDPG 公平通信 参数噪声
分 类 号:V279[航空宇航科学与技术—飞行器设计] TN929.5[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7