新的启发式Q学习算法  被引量:1

Novel Heuristic Q-learning Algorithm

在线阅读下载全文

作  者:王洪彦[1] 

机构地区:[1]沈阳航空工业学院计算机学院,沈阳110136

出  处:《计算机工程》2009年第22期173-175,共3页Computer Engineering

基  金:辽宁省自然科学基金资助项目"基于P2P的MMOG关键技术的研究"(20052007);辽宁省教育厅攻关计划基金资助项目"网络游戏引擎及其相关技术的研究"(2004D116)

摘  要:针对连续型强化学习问题,提出一种综合启发函数和评估函数的Q学习算法,利用启发函数加快学习速度,采用评估函数减少不必要的探索,提高学习效率。为了保证该算法的有效性,启发函数和评估函数根据Q函数进行计算。坦克大战游戏的仿真实验结果证明,该方法可以较大地提高Q学习的学习效率。Aiming at the continuity consolidate study, this paper presents a Q-learning algorithm which integrates heuristic function and evaluation function. It takes advance of heuristic function to accelerate learning, uses evaluation function to reduce the unnecessary exploration and improves learning efficiency. To assure the effect of the algorithm, heuristic function and evaluation function are calculated by Q function. Simulation experimental result of the Tank game proves that the algorithm can improve the learning efficiency of Q-learning.

关 键 词:Q学习 启发函数 评估函数 网络游戏 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象