[1]于建均,姚红柯,左国玉,等.基于动态系统的机器人模仿学习方法研究[J].智能系统学报,2019,14(5):1026-1034.[doi:10.11992/tis.201807018]
YU Jianjun,YAO Hongke,ZUO Guoyu,et al.Research on robot imitation learning method based on dynamical system[J].CAAI Transactions on Intelligent Systems,2019,14(5):1026-1034.[doi:10.11992/tis.201807018]
点击复制
《智能系统学报》[ISSN 1673-4785/CN 23-1538/TP] 卷:
14
期数:
2019年第5期
页码:
1026-1034
栏目:
学术论文—智能系统
出版日期:
2019-09-05
- Title:
-
Research on robot imitation learning method based on dynamical system
- 作者:
-
于建均1,2, 姚红柯1,2, 左国玉1,2, 阮晓钢1,2, 安硕1,2
-
1. 北京工业大学 信息学部, 北京 100124;
2. 北京工业大学 计算智能与智能系统北京市重点实验室, 北京 100124
- Author(s):
-
YU Jianjun1,2, YAO Hongke1,2, ZUO Guoyu1,2, RUAN Xiaogang1,2, AN Shuo1,2
-
1. Faculty of Information Technology, Beijing University of Technology, Beijing 100124, China;
2. Beijing Key Laboratory of Compu-tational Intelligence and Intelligent System, Beijing University of Technology, Beijing 100124, China
-
- 关键词:
-
机器人; 模仿学习; 轨迹层面; 高斯混合模型; 动态系统; 参数学习; 7bot机械臂; 泛化能力
- Keywords:
-
robot; imitation learning; trajectory level; Gaussian mixture model; dynamical system; parameter learning; 7bot manipulator; generalization performance
- 分类号:
-
TP242.6
- DOI:
-
10.11992/tis.201807018
- 摘要:
-
针对当前机器人模仿学习过程中,运动模仿存在无法收敛到目标点以及泛化能力差的问题,引入一种基于动态系统(dynamical system,DS)的模仿学习方法。该方法通过高斯混合模型(gaussian mixture model,GMM)将示教运动数据建模为一非线性动态系统;将DS全局稳定的充分条件作为约束,以保证DS所生成的所有轨迹收敛到目标点;将动态系统模型的参数学习问题转化为求解一个约束优化问题,从而得到模型参数。以7bot机械臂为实验对象,进行仿真实验和机器人实验,实验结果表明:该方法学习的DS模型从不同起点生成的所有轨迹都收敛到目标点,轨迹平滑,泛化能力好。
- Abstract:
-
In the current robot imitation learning process, the motion imitation cannot converge to the target point, and the generalization ability is poor. To solve this problem, an imitation learning method based on dynamical system (DS) is introduced. First, the demonstration motion data is modeled as a nonlinear DS by Gaussian mixture model (GMM). Second, the sufficient condition of DS global stability is used as a constraint to ensure that all the DS-generated trajectories converge to the target. Finally, the parameter learning problem of the DS model is transformed into seeking for a solution to a constrained optimization problem to obtain the model parameters. Simulation experiments and robot experiments were carried out using the 7bot manipulator. The experimental results show that all the trajectories generated by the DS model from different starting points converged to the target point, and the trajectory was smooth and the generalization performance was improved.
备注/Memo
收稿日期:2018-07-18。
基金项目:国家自然科学基金项目(61773027);北京市自然科学基金项目(4182008);北京市自然科学基金项目/北京市教育委员会科技计划重点项目(KZ201610005010).
作者简介:于建均,女,1965年生,副教授,主要研究方向为智能机器人的仿生自主控制、智能计算与智能优化控制、复杂过程建模、优化与控制。主持或参与国家"863"计划项目、国家自然科学基金等省部级科研项目以及横向科研课题多项。取得国家发明专利、实用新型专利、国家软件著作权10余项。发表SCI、EI、ISTP收录论文40余篇;姚红柯,男,1991年生,硕士研究生,主要研究方向为机器学习、机器人行为模仿和控制;左国玉,男,1971年生,副教授,博士,主要研究方向为机器人学习与控制。主持科研项目10余项,取得国家发明专利20余项。发表学术论文40余篇。
通讯作者:左国玉.E-mail:zuoguoyu@bjut.edu.cn
更新日期/Last Update:
1900-01-01