《智能系统学报》 过刊查询页面

    关键词中包括 reinforcement learning 的文章

1 仿生机器人运动步态控制:强化学习方法综述
郭宪, 方勇纯 2020年1期 [152-159][摘要](210)[pdf 3295KB](265)
2 深度强化学习中状态注意力机制的研究
申翔翔1, 侯新文2, 尹传环1 2020年2期 [317-322][摘要](140)[pdf 4039KB](74)
3 事件驱动的强化学习多智能体编队控制
徐鹏1, 谢广明1,2,3, 文家燕1,2, 高远1 2019年01期 [93-98][摘要](967)[pdf 4457KB](477)
4 分层强化学习综述
周文吉, 俞扬 2017年05期 [590-594][摘要](2107)[pdf 906KB](4458)
5 基于事件驱动的多智能体强化学习研究
张文旭, 马磊, 王晓东 2017年01期 [82-87][摘要](1661)[pdf 1289KB](1375)
6 基于强化学习的多定位组件自动选择方法
梁爽1, 曹其新1, 王雯珊1, 邹风山2 2016年2期 [149-154][摘要](1320)[pdf 1456KB](1081)
7 面向资源分配问题的Q-CF多智能体强化学习
连传强,徐昕,吴军,李兆斌 2011年02期 [95-100][摘要](2722)[pdf 551KB](1063)
DOI:
8 回报函数学习的学徒学习综述
金卓军,钱  徽,陈沈轶,朱淼良 2009年03期 [208-212][摘要](3417)[pdf 310KB](2045)
DOI:
9 一种逻辑强化学习的tableau推理方法
刘 全1, 2 ,崔志明1 ,高 阳2 ,陈道蓄2 ,姚望舒1 2008年04期 [355-360][摘要](2900)[pdf 454KB](2024)
DOI:
10 增强学习中的直接策略搜索方法综述
王学宁1, 陈 伟1, 张 锰2, 徐 昕1,  贺汉根1 2007年01期 [16-24][摘要](3659)[pdf 504KB](3916)
DOI:
11 基于多智能体的Option自动生成算法
沈 晶, 顾国昌, 刘海波 2006年01期 [84-87][摘要](3078)[pdf 342KB](2289)
DOI: