基于替代传导径迹增强式学习的自主式微直升机控制  

AUTONOMOUS MICRO-HELICOPTER CONTROL BASED ON REINFORCEMENT LEARNING WITH REPLACING ELIGIBILITY TRACES

在线阅读下载全文

作  者:杨玉君[1] 程君实[1] 陈佳品[1] 张琛[1] 肖永利[1] 

机构地区:[1]上海交通大学信息存储研究中心,上海200030

出  处:《信息与控制》2003年第3期229-233,共5页Information and Control

基  金:国家自然科学基金资助项目 ( 698890 5 0 ) ;863计划资助项目 ( 863 5 12 0 4 0 1) ;总装备部资助项目

摘  要:随着微电子机械系统 (MEMS)的迅猛发展 ,自主式微直升机的研究也已成为这一领域内的研究热点之一 .由于微直升机尺寸的限制 ,不能安装功能很强的传感器和处理器 ,难以获得完全的环境信息 ,所以传统的基于模型的控制方法不适用于环境是动态的自主微直升机控制 .基于行为的控制方法采用累次逼近的方法 ,不需要环境的精确模型 ,因此系统的稳定性较好 .本文采用基于替代传导径迹的增强式学习 ,结合即时差分方法 ,提高其学习效率 ,仿真实验验证了该学习算法的有效性 .最后 。With the rapid development of MEMS, study of micro helicopter has been a hotpot in this field. Because of its overall size, the micro helicopter could not be equipped with strong sensors and MPU, which affect the helicopter to get the whole environment information, therefore, the traditional control method disagrees with the helicopter in the uncertain environment. However, the method based on behavior only uses trial and error without the exact model of the environment. We adopt reinforcement learning with replacing eligibility traces to be combined with the temporal difference learning, which improves the efficiency and speed convergence. The results of simulation prove the validity of the learning algorithms. At last, this paper introduces the existent problems with the helicopter control and gives the future study trend.

关 键 词:自主式微直升机 控制方法 微电子机械系统 增强式学习 智能体 传导径迹 传感器 

分 类 号:V275.1[航空宇航科学与技术—飞行器设计]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象