文章

《智能系统学报》过刊查询页面

关键词中包括 reinforcement learning 的文章

1	基于分层多智能体强化学习的多无人机视距内空战雍宇晨^1,2, 李子豫³, 董琦² 2025年3期 [548－556][摘要](59)[pdf 4608KB](111) DOI:10.11992/tis.202408008

2	基于人工势场的防疫机器人改进近端策略优化算法伍锡如, 沈可扬 2025年3期 [689－698][摘要](47)[pdf 4889KB](102) DOI:10.11992/tis.202407026

3	基于改进DDQN船舶自动靠泊路径规划方法李康斌, 朱齐丹, 牟进友, 菅紫婷 2025年1期 [73－80][摘要](1272)[pdf 4790KB](1053) DOI:10.11992/tis.202401005

4	数据中心冷热电联产系统的前摄式智能节能优化算法李庆华¹, 冉泳屹¹, 刘启晨², 孙彤瑶¹, 陈双武³, 雒江涛¹ 2025年1期 [139－149][摘要](1166)[pdf 5245KB](1116) DOI:10.11992/tis.202312037

5	基于强化学习与直接升力的舰载机自动着舰控制王子博, 朱齐丹, 孔令鑫, 王立鹏 2025年2期 [416－424][摘要](1245)[pdf 4851KB](1535) DOI:10.11992/tis.202312026

6	基于深度强化学习的电力线与无线双模通信MAC层接入算法陈智雄^1,2, 詹学滋¹, 左嘉烁¹ 2025年2期 [344－354][摘要](1255)[pdf 4917KB](1527) DOI:10.11992/tis.202312023

7	洋流干扰下低速欠驱动AUV的三维路径规划陈世同, 鲁子瑜 2025年2期 [425－434][摘要](1251)[pdf 17308KB](2239) DOI:10.11992/tis.202311004

8	基于数据质量评估的高效强化联邦学习节点动态采样优化赵泽华, 梁美玉, 薛哲, 李昂, 张珉 2024年6期 [1552－1561][摘要](565)[pdf 4047KB](545) DOI:10.11992/tis.202305054

9	融合专家纠偏策略的移动机器人动态环境避障方法田顺钰, 欧阳勇平, 魏长赟 2024年6期 [1492－1502][摘要](740)[pdf 5668KB](570) DOI:10.11992/tis.202304056

10	规则耦合下的多异构子网络MADDPG博弈对抗算法张钰欣, 赵恩娇, 赵玉新 2024年1期 [190－208][摘要](1803)[pdf 11337KB](1192) DOI:10.11992/tis.202303037

11	麻将博弈AI构建方法综述李霞丽^1,2, 王昭琦^1,2, 刘博^1,2, 吴立成^1,2 2023年6期 [1143－1155][摘要](4260)[pdf 4563KB](3280) DOI:10.11992/tis.202211028

12	基于强化学习的水下高速航行体纵向运动控制研究白涛, 董勤浩, 冯梓昆, 李雪华 2023年5期 [902－916][摘要](2067)[pdf 6231KB](1666) DOI:10.11992/tis.202203024

13	车辆多目标交互行为建模的轨迹预测方法赵靖文, 李煊鹏, 张为公 2023年3期 [480－488][摘要](2291)[pdf 4476KB](2006) DOI:10.11992/tis.202201022

14	基于深度强化学习的动态装配算法王竣禾^1,2,3, 姜勇^1,2 2023年1期 [2－11][摘要](3057)[pdf 3362KB](2013) DOI:10.11992/tis.202201006

15	基于深度强化学习的节能工艺路线发现方法陶鑫钰^1,2, 王艳^1,2, 纪志成^1,2 2023年1期 [23－35][摘要](2688)[pdf 5273KB](2037) DOI:10.11992/tis.202112030

16	场景图谱驱动目标搜索的多智能体强化学习陆升阳¹, 赵怀林¹, 刘华平² 2023年1期 [207－215][摘要](2665)[pdf 4586KB](2035) DOI:10.11992/tis.202111034

17	基于深度强化学习的室内视觉局部路径规划朱少凯, 孟庆浩, 金晟, 戴旭阳 2022年5期 [908－918][摘要](3659)[pdf 5100KB](2520) DOI:10.11992/tis.202107059

18	旋翼无人机在移动平台降落的控制参数自学习调节方法张鹏鹏, 魏长赟, 张恺睿, 欧阳勇平 2022年5期 [931－940][摘要](2786)[pdf 5359KB](2262) DOI:10.11992/tis.202107040

19	动态环境下分布式异构多机器人避障方法研究欧阳勇平¹, 魏长赟¹, 蔡帛良^1,2 2022年4期 [752－763][摘要](3372)[pdf 8570KB](2105) DOI:10.11992/tis.202106044

20	基于强化学习的海洋移动观测网络观测路径规划方法赵玉新¹, 杜登辉¹, 成小会¹, 周迪², 邓雄¹, 刘延龙¹ 2022年1期 [192－200][摘要](5822)[pdf 5755KB](2485) DOI:10.11992/tis.202106004

21	基于强化学习的参数自整定及优化算法严家政¹, 专祥涛^1,2 2022年2期 [341－347][摘要](5289)[pdf 3881KB](2453) DOI:10.11992/tis.202012038

22	强化学习稀疏奖励算法研究——理论与实验杨瑞¹, 严江鹏¹, 李秀^1,2 2020年5期 [888－899][摘要](6668)[pdf 4915KB](3260) DOI:10.11992/tis.202003031

23	记忆神经网络在机器人导航领域的应用与研究进展王作为^1,2, 徐征^3,4, 张汝波⁵, 洪才森¹, 王殊¹ 2020年5期 [835－846][摘要](7704)[pdf 4964KB](4429) DOI:10.11992/tis.202002020

24	基于注意力融合的图像描述生成方法莫宏伟, 田朋 2020年4期 [740－749][摘要](6796)[pdf 3533KB](2774) DOI:10.11992/tis.201910039

25	多智能体分层强化学习综述殷昌盛, 杨若鹏, 朱巍, 邹小飞, 李峰 2020年4期 [646－655][摘要](10330)[pdf 4674KB](5362) DOI:10.11992/tis.201909027

26	仿生机器人运动步态控制：强化学习方法综述郭宪, 方勇纯 2020年1期 [152－159][摘要](6670)[pdf 2932KB](3889) DOI:10.11992/tis.201907052

27	深度强化学习中状态注意力机制的研究申翔翔¹, 侯新文², 尹传环¹ 2020年2期 [317－322][摘要](6897)[pdf 4039KB](3162) DOI:10.11992/tis.201809033

28	事件驱动的强化学习多智能体编队控制徐鹏¹, 谢广明^1,2,3, 文家燕^1,2, 高远¹ 2019年1期 [93－98][摘要](7380)[pdf 4457KB](3258) DOI:10.11992/tis.201807010

29	分层强化学习综述周文吉, 俞扬 2017年5期 [590－594][摘要](14875)[pdf 906KB](11501) DOI:10.11992/tis.201706031

30	基于事件驱动的多智能体强化学习研究张文旭, 马磊, 王晓东 2017年1期 [82－87][摘要](7821)[pdf 1289KB](3965) DOI:10.11992/tis.201604008

31	基于强化学习的多定位组件自动选择方法梁爽¹, 曹其新¹, 王雯珊¹, 邹风山² 2016年2期 [149－154][摘要](6508)[pdf 1456KB](3126) DOI:10.11992/tis.201510031

32	面向资源分配问题的Q-CF多智能体强化学习连传强，徐昕，吴军，李兆斌 2011年2期 [95－100][摘要](5845)[pdf 551KB](2932) DOI:

33	回报函数学习的学徒学习综述金卓军，钱? 徽，陈沈轶，朱淼良 2009年3期 [208－212][摘要](6180)[pdf 310KB](4523) DOI:

34	一种逻辑强化学习的tableau推理方法刘　全^{1, 2} ,崔志明¹,高　阳² ,陈道蓄² ,姚望舒¹ 2008年4期 [355－360][摘要](5264)[pdf 454KB](4484) DOI:

35	增强学习中的直接策略搜索方法综述王学宁¹, 陈伟¹, 张锰², 徐昕¹,? 贺汉根¹ 2007年1期 [16－24][摘要](8932)[pdf 504KB](9594) DOI:

36	基于多智能体的Option自动生成算法沈晶, 顾国昌, 刘海波 2006年1期 [84－87][摘要](5579)[pdf 342KB](4367) DOI: