基于R学习的合同网实时调度模型被引量：1

Real-time contract-net-protocol scheduling model based on R-learning

出　　处：《计算机工程与应用》2014年第10期221-226,237,共7页Computer Engineering and Applications

基　　金：广东省自然科学基金资助项目(No.8452902001001552)

摘　　要：提出一种融入合同网运行机制的R学习方法,以此方法为核心构造Agent形成具有学习能力的实时调度模型。模型以最小化作业累计平均流动比为主要目标,同时借助对强化学习报酬的设计减小机器负载的不均衡性,实现对调度过程的双重优化;构造实时调度实例投入测试的结果证明了模型的绩效。另外,一个包含强化学习Agent与无学习Agent的混合机器环境被构建并测试其性能,测试结果表明:在Agent之间借助强化学习过程形成了某种隐性的合作,正是这种合作保证了高质量实时调度方案的输出。This paper proposes a real-time scheduling model based on contract net protocol structure employing reinforcement learning agents. To this end, an R-learning procedure is elaborated and embedded in machine agents’decision process, enabling them to treat bid-invitations in more complicated way than in a simple contract net protocol environment. Efficiency of the proposed method is verified through experiments in a simulated real-time scheduling environment. Furthermore, the performance of mixed machine groups which comprises both reinforcement learning agents and non-reinforcement-learning agents shows that there is spontaneous implicit teamwork occurring between reinforcement learning agents, and this teamwork guarantees high quality output of the scheduling model.

关键词：R学习合同网多AGENT合作实时调度

分类号：TP18[自动化与计算机技术—控制理论与控制工程]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于R学习的合同网实时调度模型被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于R学习的合同网实时调度模型 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于R学习的合同网实时调度模型被引量：1