文章

《智能系统学报》过刊查询页面

关键词中包括 reinforcement learning 的文章

1	基于改进深度Q网络的智能网联汽车路径规划文家燕^1,2, 王怡博^1,2, 辛华健³, 谢广明⁴ 2026年1期 [226－235][摘要](539)[pdf 5120KB](472) DOI:10.11992/tis.202502010

2	基于深度行为评判策略的5G光伏基站低碳绿能方法邓翠艳¹, 齐小刚² 2025年5期 [1198－1206][摘要](1681)[pdf 4352KB](1172) DOI:10.11992/tis.202501024

3	基于自适应分位数的离线强化学习算法周娴玮, 王宇翔, 罗仕鑫, 余松森 2025年5期 [1093－1102][摘要](2052)[pdf 5131KB](1387) DOI:10.11992/tis.202410016

4	基于分层多智能体强化学习的多无人机视距内空战雍宇晨^1,2, 李子豫³, 董琦² 2025年3期 [548－556][摘要](1824)[pdf 4608KB](3297) DOI:10.11992/tis.202408008

5	基于强化学习的超高层建筑非法入侵情景推演方法胡今鸣¹, 胡啸峰^1,2,3, 石磊⁴, 石拓⁵, 滕腾¹ 2025年4期 [958－968][摘要](2985)[pdf 5528KB](2619) DOI:10.11992/tis.202408002

6	基于人工势场的防疫机器人改进近端策略优化算法伍锡如, 沈可扬 2025年3期 [689－698][摘要](1494)[pdf 4889KB](1704) DOI:10.11992/tis.202407026

7	基于改进DDQN船舶自动靠泊路径规划方法李康斌, 朱齐丹, 牟进友, 菅紫婷 2025年1期 [73－80][摘要](2707)[pdf 4790KB](2637) DOI:10.11992/tis.202401005

8	数据中心冷热电联产系统的前摄式智能节能优化算法李庆华¹, 冉泳屹¹, 刘启晨², 孙彤瑶¹, 陈双武³, 雒江涛¹ 2025年1期 [139－149][摘要](2593)[pdf 5245KB](2569) DOI:10.11992/tis.202312037

9	基于强化学习与直接升力的舰载机自动着舰控制王子博, 朱齐丹, 孔令鑫, 王立鹏 2025年2期 [416－424][摘要](2742)[pdf 4851KB](3090) DOI:10.11992/tis.202312026

10	基于深度强化学习的电力线与无线双模通信MAC层接入算法陈智雄^1,2, 詹学滋¹, 左嘉烁¹ 2025年2期 [344－354][摘要](2653)[pdf 4917KB](2998) DOI:10.11992/tis.202312023

11	洋流干扰下低速欠驱动AUV的三维路径规划陈世同, 鲁子瑜 2025年2期 [425－434][摘要](2587)[pdf 17308KB](3756) DOI:10.11992/tis.202311004

12	基于数据质量评估的高效强化联邦学习节点动态采样优化赵泽华, 梁美玉, 薛哲, 李昂, 张珉 2024年6期 [1552－1561][摘要](1941)[pdf 4047KB](2011) DOI:10.11992/tis.202305054

13	融合专家纠偏策略的移动机器人动态环境避障方法田顺钰, 欧阳勇平, 魏长赟 2024年6期 [1492－1502][摘要](2288)[pdf 5668KB](1897) DOI:10.11992/tis.202304056

14	规则耦合下的多异构子网络MADDPG博弈对抗算法张钰欣, 赵恩娇, 赵玉新 2024年1期 [190－208][摘要](3052)[pdf 11337KB](2720) DOI:10.11992/tis.202303037

15	麻将博弈AI构建方法综述李霞丽^1,2, 王昭琦^1,2, 刘博^1,2, 吴立成^1,2 2023年6期 [1143－1155][摘要](6166)[pdf 4563KB](5342) DOI:10.11992/tis.202211028

16	基于强化学习的水下高速航行体纵向运动控制研究白涛, 董勤浩, 冯梓昆, 李雪华 2023年5期 [902－916][摘要](3255)[pdf 6231KB](3098) DOI:10.11992/tis.202203024

17	车辆多目标交互行为建模的轨迹预测方法赵靖文, 李煊鹏, 张为公 2023年3期 [480－488][摘要](4138)[pdf 4476KB](3995) DOI:10.11992/tis.202201022

18	基于深度强化学习的动态装配算法王竣禾^1,2,3, 姜勇^1,2 2023年1期 [2－11][摘要](4358)[pdf 3362KB](3258) DOI:10.11992/tis.202201006

19	基于深度强化学习的节能工艺路线发现方法陶鑫钰^1,2, 王艳^1,2, 纪志成^1,2 2023年1期 [23－35][摘要](3835)[pdf 5273KB](3264) DOI:10.11992/tis.202112030

20	场景图谱驱动目标搜索的多智能体强化学习陆升阳¹, 赵怀林¹, 刘华平² 2023年1期 [207－215][摘要](3939)[pdf 4586KB](3311) DOI:10.11992/tis.202111034

21	基于深度强化学习的室内视觉局部路径规划朱少凯, 孟庆浩, 金晟, 戴旭阳 2022年5期 [908－918][摘要](5565)[pdf 5100KB](4112) DOI:10.11992/tis.202107059

22	旋翼无人机在移动平台降落的控制参数自学习调节方法张鹏鹏, 魏长赟, 张恺睿, 欧阳勇平 2022年5期 [931－940][摘要](3919)[pdf 5359KB](3644) DOI:10.11992/tis.202107040

23	动态环境下分布式异构多机器人避障方法研究欧阳勇平¹, 魏长赟¹, 蔡帛良^1,2 2022年4期 [752－763][摘要](4446)[pdf 8570KB](3345) DOI:10.11992/tis.202106044

24	基于强化学习的海洋移动观测网络观测路径规划方法赵玉新¹, 杜登辉¹, 成小会¹, 周迪², 邓雄¹, 刘延龙¹ 2022年1期 [192－200][摘要](7158)[pdf 5755KB](3779) DOI:10.11992/tis.202106004

25	基于强化学习的参数自整定及优化算法严家政¹, 专祥涛^1,2 2022年2期 [341－347][摘要](6437)[pdf 3881KB](3566) DOI:10.11992/tis.202012038

26	强化学习稀疏奖励算法研究——理论与实验杨瑞¹, 严江鹏¹, 李秀^1,2 2020年5期 [888－899][摘要](8123)[pdf 4915KB](4421) DOI:10.11992/tis.202003031

27	记忆神经网络在机器人导航领域的应用与研究进展王作为^1,2, 徐征^3,4, 张汝波⁵, 洪才森¹, 王殊¹ 2020年5期 [835－846][摘要](9170)[pdf 4964KB](5895) DOI:10.11992/tis.202002020

28	基于注意力融合的图像描述生成方法莫宏伟, 田朋 2020年4期 [740－749][摘要](8065)[pdf 3533KB](4117) DOI:10.11992/tis.201910039

29	多智能体分层强化学习综述殷昌盛, 杨若鹏, 朱巍, 邹小飞, 李峰 2020年4期 [646－655][摘要](12736)[pdf 4674KB](6990) DOI:10.11992/tis.201909027

30	仿生机器人运动步态控制：强化学习方法综述郭宪, 方勇纯 2020年1期 [152－159][摘要](7678)[pdf 2932KB](5581) DOI:10.11992/tis.201907052

31	深度强化学习中状态注意力机制的研究申翔翔¹, 侯新文², 尹传环¹ 2020年2期 [317－322][摘要](8244)[pdf 4039KB](4396) DOI:10.11992/tis.201809033

32	事件驱动的强化学习多智能体编队控制徐鹏¹, 谢广明^1,2,3, 文家燕^1,2, 高远¹ 2019年1期 [93－98][摘要](8635)[pdf 4457KB](4489) DOI:10.11992/tis.201807010

33	分层强化学习综述周文吉, 俞扬 2017年5期 [590－594][摘要](19203)[pdf 906KB](15829) DOI:10.11992/tis.201706031

34	基于事件驱动的多智能体强化学习研究张文旭, 马磊, 王晓东 2017年1期 [82－87][摘要](8943)[pdf 1289KB](5201) DOI:10.11992/tis.201604008

35	基于强化学习的多定位组件自动选择方法梁爽¹, 曹其新¹, 王雯珊¹, 邹风山² 2016年2期 [149－154][摘要](7448)[pdf 1456KB](4378) DOI:10.11992/tis.201510031

36	面向资源分配问题的Q-CF多智能体强化学习连传强，徐昕，吴军，李兆斌 2011年2期 [95－100][摘要](6930)[pdf 551KB](4191) DOI:

37	回报函数学习的学徒学习综述金卓军，钱? 徽，陈沈轶，朱淼良 2009年3期 [208－212][摘要](7520)[pdf 310KB](5896) DOI:

38	一种逻辑强化学习的tableau推理方法刘　全^{1, 2} ,崔志明¹,高　阳² ,陈道蓄² ,姚望舒¹ 2008年4期 [355－360][摘要](7883)[pdf 454KB](5818) DOI:

39	增强学习中的直接策略搜索方法综述王学宁¹, 陈伟¹, 张锰², 徐昕¹,? 贺汉根¹ 2007年1期 [16－24][摘要](12486)[pdf 504KB](13852) DOI:

40	基于多智能体的Option自动生成算法沈晶, 顾国昌, 刘海波 2006年1期 [84－87][摘要](6712)[pdf 342KB](5531) DOI: