一种激励学习遗忘算法被引量：1

A Kind of Forgetting Reinforcement Learning Algorithm

机构地区：[1]苏州农业职业技术学院,苏州215008 [2]苏州大学计算机科学与技术学院,苏州215006

出　　处：《计算机工程与应用》2004年第30期61-64,共4页Computer Engineering and Applications

基　　金：江苏省自然科学基金(编号:BK2002040);江苏省教育厅自然科学基金(编号:02KJB520001)资助

摘　　要：提出了一种基于动态规划方法的激励学习遗忘算法,这个算法是通过将记忆心理学中有关遗忘的基本原理引入到值函数的激励学习中,导出了一类用动态规划方法解决激励学习问题的比较好的方法,即Forget-DP算法。In this paper we give a forgetting algorithm,which introduces the forgetting principles in psychology to reinforcement learning about value functions.Using forgetting algorithm,we discuss that problem describing above.

关键词：动态规划值函数记忆遗忘算法

分类号：TP18[自动化与计算机技术—控制理论与控制工程]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种激励学习遗忘算法被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种激励学习遗忘算法 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

一种激励学习遗忘算法被引量：1