一种基于多Agent强化学习的多星协同任务规划算法被引量：22

An Algorithm of Cooperative Multiple Satellites Mission Planning Based on Multi-agent Reinforcement Learning

出　　处：《国防科技大学学报》2011年第1期53-58,共6页Journal of National University of Defense Technology

基　　金：国家自然科学基金资助项目(60604035);国家863高技术资助项目(2007AA12020203)

摘　　要：在分析任务特点和卫星约束的基础上给出了多星协同任务规划问题的数学模型。引入约束惩罚算子和多星联合惩罚算子对卫星Agent原始的效用值增益函数进行改进,在此基础上提出了一种多卫星Agent强化学习算法以求解多星协同任务分配策略,设计了基于黑板结构的多星交互方式以降低学习交互过程中的通信代价。通过仿真实验及分析证明该方法能够有效解决多星协同任务规划问题。A multi-satellite cooperative planning problem model was given considering the characteristics of the task requests and satellite constraints.Then the original performance function of each satellite agent was modified by introducing both the constraint punishing operator and the multi-satellite joint punishing operator.Next,a multi-satellite reinforcement learning algorithm（MUSARLA） was proposed to derive the coordinated task allocation strategy.Furthermore,the interaction among multiple satellites was designed based on blackboard architecture to reduce the communication cost while learning.Finally,simulated experiments are carried out which verified the effectiveness of the proposed algorithm.

关键词：卫星任务规划协同规划多智能体强化学习黑板结构

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种基于多Agent强化学习的多星协同任务规划算法被引量：22

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种基于多Agent强化学习的多星协同任务规划算法 被引量：22

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

一种基于多Agent强化学习的多星协同任务规划算法被引量：22