《智能系统学报》
过刊查询页面
关键词中包括
reinforcement learning
的文章
1
基于改进DDQN船舶自动靠泊路径规划方法
李康斌, 朱齐丹, 牟进友, 菅紫婷 2025年1期 [73-80][
摘要
](
746
)
[
pdf
4790KB]
(
548
)
DOI:
10.11992/tis.202401005
2
数据中心冷热电联产系统的前摄式智能节能优化算法
李庆华
1
, 冉泳屹
1
, 刘启晨
2
, 孙彤瑶
1
, 陈双武
3
, 雒江涛
1
2025年1期 [139-149][
摘要
](
668
)
[
pdf
5245KB]
(
594
)
DOI:
10.11992/tis.202312037
3
基于强化学习与直接升力的舰载机自动着舰控制
王子博, 朱齐丹, 孔令鑫, 王立鹏 2025年2期 [416-424][
摘要
](
239
)
[
pdf
4851KB]
(
126
)
DOI:
10.11992/tis.202312026
4
基于深度强化学习的电力线与无线双模通信MAC层接入算法
陈智雄
1,2
, 詹学滋
1
, 左嘉烁
1
2025年2期 [344-354][
摘要
](
259
)
[
pdf
4917KB]
(
120
)
DOI:
10.11992/tis.202312023
5
洋流干扰下低速欠驱动AUV的三维路径规划
陈世同, 鲁子瑜 2025年2期 [425-434][
摘要
](
243
)
[
pdf
17308KB]
(
113
)
DOI:
10.11992/tis.202311004
6
基于数据质量评估的高效强化联邦学习节点动态采样优化
赵泽华, 梁美玉, 薛哲, 李昂, 张珉 2024年6期 [1552-1561][
摘要
](
255
)
[
pdf
4047KB]
(
204
)
DOI:
10.11992/tis.202305054
7
融合专家纠偏策略的移动机器人动态环境避障方法
田顺钰, 欧阳勇平, 魏长赟 2024年6期 [1492-1502][
摘要
](
302
)
[
pdf
5668KB]
(
199
)
DOI:
10.11992/tis.202304056
8
规则耦合下的多异构子网络MADDPG博弈对抗算法
张钰欣, 赵恩娇, 赵玉新 2024年1期 [190-208][
摘要
](
1468
)
[
pdf
11337KB]
(
900
)
DOI:
10.11992/tis.202303037
9
麻将博弈AI构建方法综述
李霞丽
1,2
, 王昭琦
1,2
, 刘博
1,2
, 吴立成
1,2
2023年6期 [1143-1155][
摘要
](
3748
)
[
pdf
4563KB]
(
2086
)
DOI:
10.11992/tis.202211028
10
基于强化学习的水下高速航行体纵向运动控制研究
白涛, 董勤浩, 冯梓昆, 李雪华 2023年5期 [902-916][
摘要
](
1795
)
[
pdf
6231KB]
(
1378
)
DOI:
10.11992/tis.202203024
11
车辆多目标交互行为建模的轨迹预测方法
赵靖文, 李煊鹏, 张为公 2023年3期 [480-488][
摘要
](
1923
)
[
pdf
4476KB]
(
1703
)
DOI:
10.11992/tis.202201022
12
基于深度强化学习的动态装配算法
王竣禾
1,2,3
, 姜勇
1,2
2023年1期 [2-11][
摘要
](
2609
)
[
pdf
3362KB]
(
1754
)
DOI:
10.11992/tis.202201006
13
基于深度强化学习的节能工艺路线发现方法
陶鑫钰
1,2
, 王艳
1,2
, 纪志成
1,2
2023年1期 [23-35][
摘要
](
2416
)
[
pdf
5273KB]
(
1742
)
DOI:
10.11992/tis.202112030
14
场景图谱驱动目标搜索的多智能体强化学习
陆升阳
1
, 赵怀林
1
, 刘华平
2
2023年1期 [207-215][
摘要
](
2359
)
[
pdf
4586KB]
(
1774
)
DOI:
10.11992/tis.202111034
15
基于深度强化学习的室内视觉局部路径规划
朱少凯, 孟庆浩, 金晟, 戴旭阳 2022年5期 [908-918][
摘要
](
3277
)
[
pdf
5100KB]
(
2181
)
DOI:
10.11992/tis.202107059
16
旋翼无人机在移动平台降落的控制参数自学习调节方法
张鹏鹏, 魏长赟, 张恺睿, 欧阳勇平 2022年5期 [931-940][
摘要
](
2490
)
[
pdf
5359KB]
(
1879
)
DOI:
10.11992/tis.202107040
17
动态环境下分布式异构多机器人避障方法研究
欧阳勇平
1
, 魏长赟
1
, 蔡帛良
1,2
2022年4期 [752-763][
摘要
](
3096
)
[
pdf
8570KB]
(
1869
)
DOI:
10.11992/tis.202106044
18
基于强化学习的海洋移动观测网络观测路径规划方法
赵玉新
1
, 杜登辉
1
, 成小会
1
, 周迪
2
, 邓雄
1
, 刘延龙
1
2022年1期 [192-200][
摘要
](
5528
)
[
pdf
5755KB]
(
2233
)
DOI:
10.11992/tis.202106004
19
基于强化学习的参数自整定及优化算法
严家政
1
, 专祥涛
1,2
2022年2期 [341-347][
摘要
](
5037
)
[
pdf
3881KB]
(
2204
)
DOI:
10.11992/tis.202012038
20
强化学习稀疏奖励算法研究——理论与实验
杨瑞
1
, 严江鹏
1
, 李秀
1,2
2020年5期 [888-899][
摘要
](
6327
)
[
pdf
4915KB]
(
2967
)
DOI:
10.11992/tis.202003031
21
记忆神经网络在机器人导航领域的应用与研究进展
王作为
1,2
, 徐征
3,4
, 张汝波
5
, 洪才森
1
, 王殊
1
2020年5期 [835-846][
摘要
](
7259
)
[
pdf
4964KB]
(
4057
)
DOI:
10.11992/tis.202002020
22
基于注意力融合的图像描述生成方法
莫宏伟, 田朋 2020年4期 [740-749][
摘要
](
6374
)
[
pdf
3533KB]
(
2533
)
DOI:
10.11992/tis.201910039
23
多智能体分层强化学习综述
殷昌盛, 杨若鹏, 朱巍, 邹小飞, 李峰 2020年4期 [646-655][
摘要
](
9824
)
[
pdf
4674KB]
(
4891
)
DOI:
10.11992/tis.201909027
24
仿生机器人运动步态控制:强化学习方法综述
郭宪, 方勇纯 2020年1期 [152-159][
摘要
](
6276
)
[
pdf
2932KB]
(
3208
)
DOI:
10.11992/tis.201907052
25
深度强化学习中状态注意力机制的研究
申翔翔
1
, 侯新文
2
, 尹传环
1
2020年2期 [317-322][
摘要
](
6498
)
[
pdf
4039KB]
(
2908
)
DOI:
10.11992/tis.201809033
26
事件驱动的强化学习多智能体编队控制
徐鹏
1
, 谢广明
1,2,3
, 文家燕
1,2
, 高远
1
2019年1期 [93-98][
摘要
](
6981
)
[
pdf
4457KB]
(
3006
)
DOI:
10.11992/tis.201807010
27
分层强化学习综述
周文吉, 俞扬 2017年5期 [590-594][
摘要
](
14080
)
[
pdf
906KB]
(
10708
)
DOI:
10.11992/tis.201706031
28
基于事件驱动的多智能体强化学习研究
张文旭, 马磊, 王晓东 2017年1期 [82-87][
摘要
](
7384
)
[
pdf
1289KB]
(
3681
)
DOI:
10.11992/tis.201604008
29
基于强化学习的多定位组件自动选择方法
梁爽
1
, 曹其新
1
, 王雯珊
1
, 邹风山
2
2016年2期 [149-154][
摘要
](
6110
)
[
pdf
1456KB]
(
2875
)
DOI:
10.11992/tis.201510031
30
面向资源分配问题的Q-CF多智能体强化学习
连传强,徐昕,吴军,李兆斌 2011年2期 [95-100][
摘要
](
5504
)
[
pdf
551KB]
(
2757
)
DOI:
31
回报函数学习的学徒学习综述
金卓军,钱? 徽,陈沈轶,朱淼良 2009年3期 [208-212][
摘要
](
5779
)
[
pdf
310KB]
(
4182
)
DOI:
32
一种逻辑强化学习的tableau推理方法
刘 全
1, 2
,崔志明
1
,高 阳
2
,陈道蓄
2
,姚望舒
1
2008年4期 [355-360][
摘要
](
4876
)
[
pdf
454KB]
(
4235
)
DOI:
33
增强学习中的直接策略搜索方法综述
王学宁
1
, 陈 伟
1
, 张 锰
2
, 徐 昕
1
,? 贺汉根
1
2007年1期 [16-24][
摘要
](
8280
)
[
pdf
504KB]
(
8854
)
DOI:
34
基于多智能体的Option自动生成算法
沈 晶, 顾国昌, 刘海波 2006年1期 [84-87][
摘要
](
5347
)
[
pdf
342KB]
(
4143
)
DOI: