文章

《智能系统学报》过刊查询页面

关键词中包括 reinforcement learning 的文章

1	基于深度行为评判策略的5G光伏基站低碳绿能方法邓翠艳¹, 齐小刚² 2025年5期 [1198－1206][摘要](1250)[pdf 4352KB](829) DOI:10.11992/tis.202501024

2	基于自适应分位数的离线强化学习算法周娴玮, 王宇翔, 罗仕鑫, 余松森 2025年5期 [1093－1102][摘要](1407)[pdf 5131KB](1046) DOI:10.11992/tis.202410016

3	基于分层多智能体强化学习的多无人机视距内空战雍宇晨^1,2, 李子豫³, 董琦² 2025年3期 [548－556][摘要](1161)[pdf 4608KB](2442) DOI:10.11992/tis.202408008

4	基于强化学习的超高层建筑非法入侵情景推演方法胡今鸣¹, 胡啸峰^1,2,3, 石磊⁴, 石拓⁵, 滕腾¹ 2025年4期 [958－968][摘要](2507)[pdf 5528KB](2340) DOI:10.11992/tis.202408002

5	基于人工势场的防疫机器人改进近端策略优化算法伍锡如, 沈可扬 2025年3期 [689－698][摘要](987)[pdf 4889KB](1341) DOI:10.11992/tis.202407026

6	基于改进DDQN船舶自动靠泊路径规划方法李康斌, 朱齐丹, 牟进友, 菅紫婷 2025年1期 [73－80][摘要](2073)[pdf 4790KB](2021) DOI:10.11992/tis.202401005

7	数据中心冷热电联产系统的前摄式智能节能优化算法李庆华¹, 冉泳屹¹, 刘启晨², 孙彤瑶¹, 陈双武³, 雒江涛¹ 2025年1期 [139－149][摘要](2059)[pdf 5245KB](2212) DOI:10.11992/tis.202312037

8	基于强化学习与直接升力的舰载机自动着舰控制王子博, 朱齐丹, 孔令鑫, 王立鹏 2025年2期 [416－424][摘要](2114)[pdf 4851KB](2798) DOI:10.11992/tis.202312026

9	基于深度强化学习的电力线与无线双模通信MAC层接入算法陈智雄^1,2, 詹学滋¹, 左嘉烁¹ 2025年2期 [344－354][摘要](2108)[pdf 4917KB](2629) DOI:10.11992/tis.202312023

10	洋流干扰下低速欠驱动AUV的三维路径规划陈世同, 鲁子瑜 2025年2期 [425－434][摘要](2071)[pdf 17308KB](3342) DOI:10.11992/tis.202311004

11	基于数据质量评估的高效强化联邦学习节点动态采样优化赵泽华, 梁美玉, 薛哲, 李昂, 张珉 2024年6期 [1552－1561][摘要](1388)[pdf 4047KB](1568) DOI:10.11992/tis.202305054

12	融合专家纠偏策略的移动机器人动态环境避障方法田顺钰, 欧阳勇平, 魏长赟 2024年6期 [1492－1502][摘要](1714)[pdf 5668KB](1620) DOI:10.11992/tis.202304056

13	规则耦合下的多异构子网络MADDPG博弈对抗算法张钰欣, 赵恩娇, 赵玉新 2024年1期 [190－208][摘要](2627)[pdf 11337KB](2242) DOI:10.11992/tis.202303037

14	麻将博弈AI构建方法综述李霞丽^1,2, 王昭琦^1,2, 刘博^1,2, 吴立成^1,2 2023年6期 [1143－1155][摘要](5209)[pdf 4563KB](4256) DOI:10.11992/tis.202211028

15	基于强化学习的水下高速航行体纵向运动控制研究白涛, 董勤浩, 冯梓昆, 李雪华 2023年5期 [902－916][摘要](2757)[pdf 6231KB](2767) DOI:10.11992/tis.202203024

16	车辆多目标交互行为建模的轨迹预测方法赵靖文, 李煊鹏, 张为公 2023年3期 [480－488][摘要](3224)[pdf 4476KB](3461) DOI:10.11992/tis.202201022

17	基于深度强化学习的动态装配算法王竣禾^1,2,3, 姜勇^1,2 2023年1期 [2－11][摘要](3840)[pdf 3362KB](2952) DOI:10.11992/tis.202201006

18	基于深度强化学习的节能工艺路线发现方法陶鑫钰^1,2, 王艳^1,2, 纪志成^1,2 2023年1期 [23－35][摘要](3390)[pdf 5273KB](3008) DOI:10.11992/tis.202112030

19	场景图谱驱动目标搜索的多智能体强化学习陆升阳¹, 赵怀林¹, 刘华平² 2023年1期 [207－215][摘要](3489)[pdf 4586KB](2956) DOI:10.11992/tis.202111034

20	基于深度强化学习的室内视觉局部路径规划朱少凯, 孟庆浩, 金晟, 戴旭阳 2022年5期 [908－918][摘要](4678)[pdf 5100KB](3514) DOI:10.11992/tis.202107059

21	旋翼无人机在移动平台降落的控制参数自学习调节方法张鹏鹏, 魏长赟, 张恺睿, 欧阳勇平 2022年5期 [931－940][摘要](3527)[pdf 5359KB](3329) DOI:10.11992/tis.202107040

22	动态环境下分布式异构多机器人避障方法研究欧阳勇平¹, 魏长赟¹, 蔡帛良^1,2 2022年4期 [752－763][摘要](4037)[pdf 8570KB](2998) DOI:10.11992/tis.202106044

23	基于强化学习的海洋移动观测网络观测路径规划方法赵玉新¹, 杜登辉¹, 成小会¹, 周迪², 邓雄¹, 刘延龙¹ 2022年1期 [192－200][摘要](6585)[pdf 5755KB](3480) DOI:10.11992/tis.202106004

24	基于强化学习的参数自整定及优化算法严家政¹, 专祥涛^1,2 2022年2期 [341－347][摘要](5946)[pdf 3881KB](3331) DOI:10.11992/tis.202012038

25	强化学习稀疏奖励算法研究——理论与实验杨瑞¹, 严江鹏¹, 李秀^1,2 2020年5期 [888－899][摘要](7462)[pdf 4915KB](4125) DOI:10.11992/tis.202003031

26	记忆神经网络在机器人导航领域的应用与研究进展王作为^1,2, 徐征^3,4, 张汝波⁵, 洪才森¹, 王殊¹ 2020年5期 [835－846][摘要](8531)[pdf 4964KB](5371) DOI:10.11992/tis.202002020

27	基于注意力融合的图像描述生成方法莫宏伟, 田朋 2020年4期 [740－749][摘要](7649)[pdf 3533KB](3778) DOI:10.11992/tis.201910039

28	多智能体分层强化学习综述殷昌盛, 杨若鹏, 朱巍, 邹小飞, 李峰 2020年4期 [646－655][摘要](11537)[pdf 4674KB](6401) DOI:10.11992/tis.201909027

29	仿生机器人运动步态控制：强化学习方法综述郭宪, 方勇纯 2020年1期 [152－159][摘要](7358)[pdf 2932KB](5155) DOI:10.11992/tis.201907052

30	深度强化学习中状态注意力机制的研究申翔翔¹, 侯新文², 尹传环¹ 2020年2期 [317－322][摘要](7720)[pdf 4039KB](4112) DOI:10.11992/tis.201809033

31	事件驱动的强化学习多智能体编队控制徐鹏¹, 谢广明^1,2,3, 文家燕^1,2, 高远¹ 2019年1期 [93－98][摘要](8146)[pdf 4457KB](4199) DOI:10.11992/tis.201807010

32	分层强化学习综述周文吉, 俞扬 2017年5期 [590－594][摘要](18001)[pdf 906KB](14757) DOI:10.11992/tis.201706031

33	基于事件驱动的多智能体强化学习研究张文旭, 马磊, 王晓东 2017年1期 [82－87][摘要](8554)[pdf 1289KB](4874) DOI:10.11992/tis.201604008

34	基于强化学习的多定位组件自动选择方法梁爽¹, 曹其新¹, 王雯珊¹, 邹风山² 2016年2期 [149－154][摘要](7145)[pdf 1456KB](4051) DOI:10.11992/tis.201510031

35	面向资源分配问题的Q-CF多智能体强化学习连传强，徐昕，吴军，李兆斌 2011年2期 [95－100][摘要](6660)[pdf 551KB](3857) DOI:

36	回报函数学习的学徒学习综述金卓军，钱? 徽，陈沈轶，朱淼良 2009年3期 [208－212][摘要](7098)[pdf 310KB](5454) DOI:

37	一种逻辑强化学习的tableau推理方法刘　全^{1, 2} ,崔志明¹,高　阳² ,陈道蓄² ,姚望舒¹ 2008年4期 [355－360][摘要](7547)[pdf 454KB](5477) DOI:

38	增强学习中的直接策略搜索方法综述王学宁¹, 陈伟¹, 张锰², 徐昕¹,? 贺汉根¹ 2007年1期 [16－24][摘要](11657)[pdf 504KB](13000) DOI:

39	基于多智能体的Option自动生成算法沈晶, 顾国昌, 刘海波 2006年1期 [84－87][摘要](6456)[pdf 342KB](5276) DOI: