[1]梁爽,曹其新,王雯珊,等.基于强化学习的多定位组件自动选择方法[J].智能系统学报编辑部,2016,11(2):149-154.[doi:10.11992/tis.201510031]
LIANG Shuang,CAO Qixin,WANG Wenshan,et al.An automatic switching method for multiple location components based on reinforcement learning[J].CAAI Transactions on Intelligent Systems,2016,11(2):149-154.[doi:10.11992/tis.201510031]
点击复制
《智能系统学报》编辑部[ISSN 1673-4785/CN 23-1538/TP] 卷:
11
期数:
2016年第2期
页码:
149-154
栏目:
学术论文—机器学习
出版日期:
2016-04-25
- Title:
-
An automatic switching method for multiple location components based on reinforcement learning
- 作者:
-
梁爽1, 曹其新1, 王雯珊1, 邹风山2
-
1. 上海交通大学 机器人研究所, 上海 200240;
2. 新松机器人有限公司 中央研究院, 辽宁 沈阳 110000
- Author(s):
-
LIANG Shuang1, CAO Qixin1, WANG Wenshan1, ZOU Fengshan2
-
1. Research Institute of Robotics, Shanghai Jiaotong University, Shanghai 200240, China;
2. SIASUN Robot and Automation CO., LTD, Shenyang 110000, China
-
- 关键词:
-
移动机器人; 定位; 强化学习; 中间件:Monte Carlo方法; 多传感器; 模块化; 分布式系统
- Keywords:
-
mobile robot; location; reinforcement learning; middleware; Monte Carlo; multi-sensor; modularization; distributed system
- 分类号:
-
TP242.6
- DOI:
-
10.11992/tis.201510031
- 摘要:
-
在一个大规模的动态环境中,针对机器人各种定位传感器的局限性,提出了一种基于强化学习的定位组件自动选择方法。系统采用分布式架构,将机器人不同的定位传感器与定位方法封装为不同的组件。采用强化学习的方法,寻找最优策略,实现多定位组件的实时切换。仿真结果表明,该方法可以解决大型环境中,单一定位方法不能适用于整个环境的问题,能够依靠多定位组件提供可靠的机器人定位信息;环境发生改变时,通过学习的方法不需要重新配置组件,且与直接遍历组件后切换组件的方法相比,极大地减小了延时。
- Abstract:
-
To address the limitations of location sensors in large-scale dynamic environments, an automatic switching method for multiple robotic components based on reinforcement learning is proposed. This system uses distributed architecture and encapsulates different location sensors and methods into different middleware components. Reinforcement learning is employed to find the optimal strategy for deciding how to switch between components in real time. The simulation result shows that this method can solve problems that a single location method cannot in a large-scale environment and can provide reliable location information depending on multiple location components. This method can also effectively reduce the time delay compared with a method that first traverses all the components directly and then switches components.
备注/Memo
收稿日期:2015-10-29;改回日期:。
基金项目:国家自然科学基金项目(61273331).
作者简介:梁爽,女,1993年生,硕士研究生,主要研究方向为移动机器人路径规划及模块化机器人技术。曹其新,男,1960年生,教授,博士生导师,主要研究方向为智能机器人与模块化系统、机器视觉与模式识别、移动机器人、泛在机器人技术。被EI、SCI检索论文90余篇,获得发明和实用新型专利50余项。王雯珊,女,1986年生,博士研究生,主要研究方向为泛在机器人、任务规划。
通讯作者:曹其新.E-mail:qxcao@sjtu.edu.cn.
更新日期/Last Update:
1900-01-01