《智能系统学报》 过刊查询页面

    关键词中包括 reinforcement learning 的文章

1 基于改进深度Q网络的智能网联汽车路径规划
文家燕1,2, 王怡博1,2, 辛华健3, 谢广明4 2026年1期 [226-235][摘要](84)[pdf 5120KB](66)
2 基于深度行为评判策略的5G光伏基站低碳绿能方法
邓翠艳1, 齐小刚2 2025年5期 [1198-1206][摘要](1560)[pdf 4352KB](995)
3 基于自适应分位数的离线强化学习算法
周娴玮, 王宇翔, 罗仕鑫, 余松森 2025年5期 [1093-1102][摘要](1862)[pdf 5131KB](1269)
4 基于分层多智能体强化学习的多无人机视距内空战
雍宇晨1,2, 李子豫3, 董琦2 2025年3期 [548-556][摘要](1632)[pdf 4608KB](2936)
5 基于强化学习的超高层建筑非法入侵情景推演方法
胡今鸣1, 胡啸峰1,2,3, 石磊4, 石拓5, 滕腾1 2025年4期 [958-968][摘要](2829)[pdf 5528KB](2486)
6 基于人工势场的防疫机器人改进近端策略优化算法
伍锡如, 沈可扬 2025年3期 [689-698][摘要](1326)[pdf 4889KB](1580)
7 基于改进DDQN船舶自动靠泊路径规划方法
李康斌, 朱齐丹, 牟进友, 菅紫婷 2025年1期 [73-80][摘要](2487)[pdf 4790KB](2321)
8 数据中心冷热电联产系统的前摄式智能节能优化算法
李庆华1, 冉泳屹1, 刘启晨2, 孙彤瑶1, 陈双武3, 雒江涛1 2025年1期 [139-149][摘要](2415)[pdf 5245KB](2394)
9 基于强化学习与直接升力的舰载机自动着舰控制
王子博, 朱齐丹, 孔令鑫, 王立鹏 2025年2期 [416-424][摘要](2454)[pdf 4851KB](2964)
10 基于深度强化学习的电力线与无线双模通信MAC层接入算法
陈智雄1,2, 詹学滋1, 左嘉烁1 2025年2期 [344-354][摘要](2485)[pdf 4917KB](2861)
11 洋流干扰下低速欠驱动AUV的三维路径规划
陈世同, 鲁子瑜 2025年2期 [425-434][摘要](2367)[pdf 17308KB](3557)
12 基于数据质量评估的高效强化联邦学习节点动态采样优化
赵泽华, 梁美玉, 薛哲, 李昂, 张珉 2024年6期 [1552-1561][摘要](1702)[pdf 4047KB](1873)
13 融合专家纠偏策略的移动机器人动态环境避障方法
田顺钰, 欧阳勇平, 魏长赟 2024年6期 [1492-1502][摘要](2081)[pdf 5668KB](1766)
14 规则耦合下的多异构子网络MADDPG博弈对抗算法
张钰欣, 赵恩娇, 赵玉新 2024年1期 [190-208][摘要](2919)[pdf 11337KB](2478)
15 麻将博弈AI构建方法综述
李霞丽1,2, 王昭琦1,2, 刘博1,2, 吴立成1,2 2023年6期 [1143-1155][摘要](5839)[pdf 4563KB](4582)
16 基于强化学习的水下高速航行体纵向运动控制研究
白涛, 董勤浩, 冯梓昆, 李雪华 2023年5期 [902-916][摘要](3070)[pdf 6231KB](2970)
17 车辆多目标交互行为建模的轨迹预测方法
赵靖文, 李煊鹏, 张为公 2023年3期 [480-488][摘要](3869)[pdf 4476KB](3856)
18 基于深度强化学习的动态装配算法
王竣禾1,2,3, 姜勇1,2 2023年1期 [2-11][摘要](4218)[pdf 3362KB](3132)
19 基于深度强化学习的节能工艺路线发现方法
陶鑫钰1,2, 王艳1,2, 纪志成1,2 2023年1期 [23-35][摘要](3681)[pdf 5273KB](3139)
20 场景图谱驱动目标搜索的多智能体强化学习
陆升阳1, 赵怀林1, 刘华平2 2023年1期 [207-215][摘要](3786)[pdf 4586KB](3192)
21 基于深度强化学习的室内视觉局部路径规划
朱少凯, 孟庆浩, 金晟, 戴旭阳 2022年5期 [908-918][摘要](5234)[pdf 5100KB](3863)
22 旋翼无人机在移动平台降落的控制参数自学习调节方法
张鹏鹏, 魏长赟, 张恺睿, 欧阳勇平 2022年5期 [931-940][摘要](3835)[pdf 5359KB](3524)
23 动态环境下分布式异构多机器人避障方法研究
欧阳勇平1, 魏长赟1, 蔡帛良1,2 2022年4期 [752-763][摘要](4306)[pdf 8570KB](3175)
24 基于强化学习的海洋移动观测网络观测路径规划方法
赵玉新1, 杜登辉1, 成小会1, 周迪2, 邓雄1, 刘延龙1 2022年1期 [192-200][摘要](6998)[pdf 5755KB](3649)
25 基于强化学习的参数自整定及优化算法
严家政1, 专祥涛1,2 2022年2期 [341-347][摘要](6267)[pdf 3881KB](3458)
26 强化学习稀疏奖励算法研究——理论与实验
杨瑞1, 严江鹏1, 李秀1,2 2020年5期 [888-899][摘要](7922)[pdf 4915KB](4279)
27 记忆神经网络在机器人导航领域的应用与研究进展
王作为1,2, 徐征3,4, 张汝波5, 洪才森1, 王殊1 2020年5期 [835-846][摘要](8984)[pdf 4964KB](5719)
28 基于注意力融合的图像描述生成方法
莫宏伟, 田朋 2020年4期 [740-749][摘要](7939)[pdf 3533KB](4000)
29 多智能体分层强化学习综述
殷昌盛, 杨若鹏, 朱巍, 邹小飞, 李峰 2020年4期 [646-655][摘要](12362)[pdf 4674KB](6800)
30 仿生机器人运动步态控制:强化学习方法综述
郭宪, 方勇纯 2020年1期 [152-159][摘要](7587)[pdf 2932KB](5437)
31 深度强化学习中状态注意力机制的研究
申翔翔1, 侯新文2, 尹传环1 2020年2期 [317-322][摘要](8054)[pdf 4039KB](4283)
32 事件驱动的强化学习多智能体编队控制
徐鹏1, 谢广明1,2,3, 文家燕1,2, 高远1 2019年1期 [93-98][摘要](8487)[pdf 4457KB](4378)
33 分层强化学习综述
周文吉, 俞扬 2017年5期 [590-594][摘要](18844)[pdf 906KB](15548)
34 基于事件驱动的多智能体强化学习研究
张文旭, 马磊, 王晓东 2017年1期 [82-87][摘要](8830)[pdf 1289KB](5076)
35 基于强化学习的多定位组件自动选择方法
梁爽1, 曹其新1, 王雯珊1, 邹风山2 2016年2期 [149-154][摘要](7364)[pdf 1456KB](4259)
36 面向资源分配问题的Q-CF多智能体强化学习
连传强,徐昕,吴军,李兆斌 2011年2期 [95-100][摘要](6835)[pdf 551KB](4101)
DOI:
37 回报函数学习的学徒学习综述
金卓军,钱? 徽,陈沈轶,朱淼良 2009年3期 [208-212][摘要](7400)[pdf 310KB](5782)
DOI:
38 一种逻辑强化学习的tableau推理方法
刘 全1, 2 ,崔志明1 ,高 阳2 ,陈道蓄2 ,姚望舒1 2008年4期 [355-360][摘要](7774)[pdf 454KB](5702)
DOI:
39 增强学习中的直接策略搜索方法综述
王学宁1, 陈 伟1, 张 锰2, 徐 昕1,? 贺汉根1 2007年1期 [16-24][摘要](12270)[pdf 504KB](13604)
DOI:
40 基于多智能体的Option自动生成算法
沈 晶, 顾国昌, 刘海波 2006年1期 [84-87][摘要](6624)[pdf 342KB](5452)
DOI: