基于协同多智能体值分解的频谱共享  

在线阅读下载全文

作  者:张涌逸[1] 

机构地区:[1]太原师范学院计算机系,山西晋中030619

出  处:《电脑编程技巧与维护》2021年第10期122-123,共2页Computer Programming Skills & Maintenance

摘  要:在随机博弈频谱竞拍机制模型的基础上,给出基于值分解多智能体合作的频谱管理算法,算法不需要状态转移概率,考虑次用户之间的合作,把团队奖励分解为次用户的价值函数,之后将误差反向传播给各个次用户的价值函数。团队奖励分解可避免出现虚假奖励信号,提高了学习效率。

关 键 词:信道 认知无线电 频谱共享 VDN方法 

分 类 号:TN925[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象