基于复合协方差函数的多任务模仿学习算法的研究与实现  被引量:1

Multitask Imitation Learning Algorithm Based on Composite Covariance Function

在线阅读下载全文

作  者:于建均[1] 韩春晓[1] 阮晓钢[1] 刘涛[1] 徐骢驰 门玉森 

机构地区:[1]北京工业大学电子信息与控制工程学院,北京100124

出  处:《北京工业大学学报》2016年第4期499-507,共9页Journal of Beijing University of Technology

基  金:国家自然科学基金项目(61375086);高等学校博士学科点专项科研基金资助课题(20101103110007)

摘  要:针对多任务下机器人模仿学习控制策略的获取问题,构建复合协方差函数,采用高斯过程回归方法对示教机器人的示教行为样本点建立高斯过程回归模型,并对其中的超参数进行优化,从而得出模仿学习控制策略,模仿机器人应用控制策略完成模仿任务.以Braitenberg车为仿真实验研究对象,对其趋光、避障多任务的模仿学习进行研究.仿真实验研究结果表明:与基于单一协方差函数的模仿学习算法相比,基于复合协方差函数的模仿学习算法不仅能够实现单任务环境下的机器人模仿学习,而且能够实现多任务环境下的机器人模仿学习,且精度更高.任务环境改变实验研究结果表明该方法有很好的适应性.To acquire the multitask robot imitation learning control strategy, a Gauss process regression ( GPR) model was established to express the control strategy, a composite covariance function was constructed, and the sample points of the teaching behavior was used to optimized the hyperparameters in the GPR model. The control strategy was applied by the imitation robot to accomplish the imitation task. The Braitenberg vehicles were used as simulation object to research multitask ( phototaxis and obstacle avoidance tasks) imitation learning. Simulation results indicate that compared with the imitation learning algorithm based on the single covariance function, the imitation learning algorithm based on the composite covariance function can not only realize single task imitation learning, but also realize multitask imitation learning, and the precision is higher. The simulation results in various task environments indicate that the method is adaptive.

关 键 词:机器人 模仿学习 高斯过程回归 复合协方差函数 

分 类 号:TP242.6[自动化与计算机技术—检测技术与自动化装置]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象