基于支持向量回归的乒乓球机器人击球策略学习方法  被引量:1

Learning Batting Policy for a Robot Table Tennis Player Based on Support Vector Regression

在线阅读下载全文

作  者:李志奇[1] 王滨[1] 刘宏[1] 

机构地区:[1]哈尔滨工业大学机器人技术与系统国家重点实验室,黑龙江哈尔滨150080

出  处:《机器人》2014年第1期14-20,共7页Robot

基  金:国家973计划资助项目(2013CB733105)

摘  要:针对7自由度仿人型乒乓球机器人的定点回球问题,提出了一种基于支持向量回归的击球策略学习方法.首先,把机器人的击球过程形式化为击球评价函数,该函数以来球状态和击球轨迹参数为输入,以回报值为输出.然后,提出一种基于物理模型置信域的随机搜索方法以提高训练数据的采集效率,并基于ε支持向量回归(ε-SVR)对经验数据集进行泛化从而得到击球评价函数.最后,在决策过程中,采用多初值拟牛顿法最大化击球评价函数以求解出最优击球轨迹.将该方法应用于7自由度乒乓球机器人系统中,实验结果验证了其有效性.A method based on support vector regression (SVR) is proposed to learn the batting policy to return the ball to a desired location for a 7-DoF (degree of freedom) anthropomorphic table tennis robot. Firstly, table tennis playing process is formalized as the batting evaluation function, which maps the state of the incoming ball and the parameters of the batting trajectory to the reward. Then, an exploration method based on the confidence region of the physical model is proposed to collect training data efficiently, and the batting evaluation function is obtained by generalizing the training data using e support vector regression (e-SVR). Finally, the optimal batting trajectory is computed during decision process by maximizing the batting evaluation function using multi-start Quasi-Newton method. The proposed method is applied to a 7-DoF table tennis robot, and the results verifies its effectiveness.

关 键 词:乒乓球机器人 支持向量回归(SVR) 冗余自由度机械臂 

分 类 号:TP24[自动化与计算机技术—检测技术与自动化装置]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象