《智能系统学报》
过刊查询页面
关键词中包括
reward
的文章
1
基于分层多智能体强化学习的多无人机视距内空战
雍宇晨
1,2
, 李子豫
3
, 董琦
2
2025年3期 [548-556][
摘要
](
1194
)
[
pdf
4608KB]
(
2507
)
DOI:
10.11992/tis.202408008
2
基于人工势场的防疫机器人改进近端策略优化算法
伍锡如, 沈可扬 2025年3期 [689-698][
摘要
](
1030
)
[
pdf
4889KB]
(
1375
)
DOI:
10.11992/tis.202407026
3
基于改进DDQN船舶自动靠泊路径规划方法
李康斌, 朱齐丹, 牟进友, 菅紫婷 2025年1期 [73-80][
摘要
](
2137
)
[
pdf
4790KB]
(
2038
)
DOI:
10.11992/tis.202401005
4
洋流干扰下低速欠驱动AUV的三维路径规划
陈世同, 鲁子瑜 2025年2期 [425-434][
摘要
](
2117
)
[
pdf
17308KB]
(
3355
)
DOI:
10.11992/tis.202311004
5
规则耦合下的多异构子网络MADDPG博弈对抗算法
张钰欣, 赵恩娇, 赵玉新 2024年1期 [190-208][
摘要
](
2674
)
[
pdf
11337KB]
(
2264
)
DOI:
10.11992/tis.202303037
6
基于禁忌搜索的时空众包任务分配算法
潘庆先
1,2
, 殷增轩
2
, 董红斌
1
, 高照龙
3
, 童向荣
2
2020年6期 [1040-1048][
摘要
](
6075
)
[
pdf
4676KB]
(
3245
)
DOI:
10.11992/tis.202006055
7
强化学习稀疏奖励算法研究——理论与实验
杨瑞
1
, 严江鹏
1
, 李秀
1,2
2020年5期 [888-899][
摘要
](
7573
)
[
pdf
4915KB]
(
4157
)
DOI:
10.11992/tis.202003031
8
面向多机动态调度问题的两层Q学习算法
王国磊,钟诗胜,林 琳 2009年3期 [239-244][
摘要
](
5142
)
[
pdf
315KB]
(
3530
)
DOI:
9
回报函数学习的学徒学习综述
金卓军,钱? 徽,陈沈轶,朱淼良 2009年3期 [208-212][
摘要
](
7152
)
[
pdf
310KB]
(
5575
)
DOI: