检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨贺淞
机构地区:[1]广东工业大学自动化学院
出 处:《电子世界》2020年第14期62-63,共2页Electronics World
摘 要:本文提出了一种在认知无线电网络中,基于演员-评论家(Actor-critic)的深度强化学习算法的动态功率分配方案。次用户在没有任何主用户功率策略的先验信息下,应用强化学习的算法,通过不断地与环境互动进行训练来学习到相应的功率控制策略,从而能够在不影响主用户正常通信的前提下,与主用户共享同一个信道来进行通信,以满足用户的服务质量(Quality of service,QoS)。我们的实验中也表明,次用户通过与环境的互动可以学习到有效的功率控制策略,从而达到主次用户都能满足自身的QoS的目标状态,并且相比于DQN算法,Actor-critic能够更快的收敛,并且达到很低的过渡步数。
关 键 词:强化学习算法 认知无线电网络 动态功率控制 用户共享 功率控制策略 用户功率 先验信息
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.144