文章

《智能系统学报》过刊查询页面

关键词中包括 reinforcement learning 的文章

1	基于改进DDQN船舶自动靠泊路径规划方法李康斌, 朱齐丹, 牟进友, 菅紫婷 2025年1期 [73－80][摘要](1196)[pdf 4790KB](956) DOI:10.11992/tis.202401005

2	数据中心冷热电联产系统的前摄式智能节能优化算法李庆华¹, 冉泳屹¹, 刘启晨², 孙彤瑶¹, 陈双武³, 雒江涛¹ 2025年1期 [139－149][摘要](1094)[pdf 5245KB](1033) DOI:10.11992/tis.202312037

3	基于强化学习与直接升力的舰载机自动着舰控制王子博, 朱齐丹, 孔令鑫, 王立鹏 2025年2期 [416－424][摘要](1140)[pdf 4851KB](1377) DOI:10.11992/tis.202312026

4	基于深度强化学习的电力线与无线双模通信MAC层接入算法陈智雄^1,2, 詹学滋¹, 左嘉烁¹ 2025年2期 [344－354][摘要](1153)[pdf 4917KB](1367) DOI:10.11992/tis.202312023

5	洋流干扰下低速欠驱动AUV的三维路径规划陈世同, 鲁子瑜 2025年2期 [425－434][摘要](1142)[pdf 17308KB](2056) DOI:10.11992/tis.202311004

6	基于数据质量评估的高效强化联邦学习节点动态采样优化赵泽华, 梁美玉, 薛哲, 李昂, 张珉 2024年6期 [1552－1561][摘要](533)[pdf 4047KB](469) DOI:10.11992/tis.202305054

7	融合专家纠偏策略的移动机器人动态环境避障方法田顺钰, 欧阳勇平, 魏长赟 2024年6期 [1492－1502][摘要](702)[pdf 5668KB](517) DOI:10.11992/tis.202304056

8	规则耦合下的多异构子网络MADDPG博弈对抗算法张钰欣, 赵恩娇, 赵玉新 2024年1期 [190－208][摘要](1758)[pdf 11337KB](1133) DOI:10.11992/tis.202303037

9	麻将博弈AI构建方法综述李霞丽^1,2, 王昭琦^1,2, 刘博^1,2, 吴立成^1,2 2023年6期 [1143－1155][摘要](4179)[pdf 4563KB](2740) DOI:10.11992/tis.202211028

10	基于强化学习的水下高速航行体纵向运动控制研究白涛, 董勤浩, 冯梓昆, 李雪华 2023年5期 [902－916][摘要](2031)[pdf 6231KB](1597) DOI:10.11992/tis.202203024

11	车辆多目标交互行为建模的轨迹预测方法赵靖文, 李煊鹏, 张为公 2023年3期 [480－488][摘要](2232)[pdf 4476KB](1917) DOI:10.11992/tis.202201022

12	基于深度强化学习的动态装配算法王竣禾^1,2,3, 姜勇^1,2 2023年1期 [2－11][摘要](3020)[pdf 3362KB](1962) DOI:10.11992/tis.202201006

13	基于深度强化学习的节能工艺路线发现方法陶鑫钰^1,2, 王艳^1,2, 纪志成^1,2 2023年1期 [23－35][摘要](2654)[pdf 5273KB](1972) DOI:10.11992/tis.202112030

14	场景图谱驱动目标搜索的多智能体强化学习陆升阳¹, 赵怀林¹, 刘华平² 2023年1期 [207－215][摘要](2627)[pdf 4586KB](1955) DOI:10.11992/tis.202111034

15	基于深度强化学习的室内视觉局部路径规划朱少凯, 孟庆浩, 金晟, 戴旭阳 2022年5期 [908－918][摘要](3618)[pdf 5100KB](2431) DOI:10.11992/tis.202107059

16	旋翼无人机在移动平台降落的控制参数自学习调节方法张鹏鹏, 魏长赟, 张恺睿, 欧阳勇平 2022年5期 [931－940][摘要](2747)[pdf 5359KB](2176) DOI:10.11992/tis.202107040

17	动态环境下分布式异构多机器人避障方法研究欧阳勇平¹, 魏长赟¹, 蔡帛良^1,2 2022年4期 [752－763][摘要](3336)[pdf 8570KB](2054) DOI:10.11992/tis.202106044

18	基于强化学习的海洋移动观测网络观测路径规划方法赵玉新¹, 杜登辉¹, 成小会¹, 周迪², 邓雄¹, 刘延龙¹ 2022年1期 [192－200][摘要](5776)[pdf 5755KB](2435) DOI:10.11992/tis.202106004

19	基于强化学习的参数自整定及优化算法严家政¹, 专祥涛^1,2 2022年2期 [341－347][摘要](5254)[pdf 3881KB](2419) DOI:10.11992/tis.202012038

20	强化学习稀疏奖励算法研究——理论与实验杨瑞¹, 严江鹏¹, 李秀^1,2 2020年5期 [888－899][摘要](6627)[pdf 4915KB](3202) DOI:10.11992/tis.202003031

21	记忆神经网络在机器人导航领域的应用与研究进展王作为^1,2, 徐征^3,4, 张汝波⁵, 洪才森¹, 王殊¹ 2020年5期 [835－846][摘要](7630)[pdf 4964KB](4324) DOI:10.11992/tis.202002020

22	基于注意力融合的图像描述生成方法莫宏伟, 田朋 2020年4期 [740－749][摘要](6762)[pdf 3533KB](2735) DOI:10.11992/tis.201910039

23	多智能体分层强化学习综述殷昌盛, 杨若鹏, 朱巍, 邹小飞, 李峰 2020年4期 [646－655][摘要](10244)[pdf 4674KB](5256) DOI:10.11992/tis.201909027

24	仿生机器人运动步态控制：强化学习方法综述郭宪, 方勇纯 2020年1期 [152－159][摘要](6634)[pdf 2932KB](3783) DOI:10.11992/tis.201907052

25	深度强化学习中状态注意力机制的研究申翔翔¹, 侯新文², 尹传环¹ 2020年2期 [317－322][摘要](6863)[pdf 4039KB](3113) DOI:10.11992/tis.201809033

26	事件驱动的强化学习多智能体编队控制徐鹏¹, 谢广明^1,2,3, 文家燕^1,2, 高远¹ 2019年1期 [93－98][摘要](7343)[pdf 4457KB](3198) DOI:10.11992/tis.201807010

27	分层强化学习综述周文吉, 俞扬 2017年5期 [590－594][摘要](14776)[pdf 906KB](11284) DOI:10.11992/tis.201706031

28	基于事件驱动的多智能体强化学习研究张文旭, 马磊, 王晓东 2017年1期 [82－87][摘要](7778)[pdf 1289KB](3901) DOI:10.11992/tis.201604008

29	基于强化学习的多定位组件自动选择方法梁爽¹, 曹其新¹, 王雯珊¹, 邹风山² 2016年2期 [149－154][摘要](6464)[pdf 1456KB](3072) DOI:10.11992/tis.201510031

30	面向资源分配问题的Q-CF多智能体强化学习连传强，徐昕，吴军，李兆斌 2011年2期 [95－100][摘要](5811)[pdf 551KB](2883) DOI:

31	回报函数学习的学徒学习综述金卓军，钱? 徽，陈沈轶，朱淼良 2009年3期 [208－212][摘要](6071)[pdf 310KB](4430) DOI:

32	一种逻辑强化学习的tableau推理方法刘　全^{1, 2} ,崔志明¹,高　阳² ,陈道蓄² ,姚望舒¹ 2008年4期 [355－360][摘要](5042)[pdf 454KB](4420) DOI:

33	增强学习中的直接策略搜索方法综述王学宁¹, 陈伟¹, 张锰², 徐昕¹,? 贺汉根¹ 2007年1期 [16－24][摘要](8814)[pdf 504KB](9490) DOI:

34	基于多智能体的Option自动生成算法沈晶, 顾国昌, 刘海波 2006年1期 [84－87][摘要](5520)[pdf 342KB](4295) DOI: