《智能系统学报》
过刊查询页面
关键词中包括
reward
的文章
1
基于改进DDQN船舶自动靠泊路径规划方法
李康斌, 朱齐丹, 牟进友, 菅紫婷 2025年1期 [73-80][
摘要
](
1174
)
[
pdf
4790KB]
(
929
)
DOI:
10.11992/tis.202401005
2
洋流干扰下低速欠驱动AUV的三维路径规划
陈世同, 鲁子瑜 2025年2期 [425-434][
摘要
](
1086
)
[
pdf
17308KB]
(
2006
)
DOI:
10.11992/tis.202311004
3
规则耦合下的多异构子网络MADDPG博弈对抗算法
张钰欣, 赵恩娇, 赵玉新 2024年1期 [190-208][
摘要
](
1741
)
[
pdf
11337KB]
(
1118
)
DOI:
10.11992/tis.202303037
4
基于禁忌搜索的时空众包任务分配算法
潘庆先
1,2
, 殷增轩
2
, 董红斌
1
, 高照龙
3
, 童向荣
2
2020年6期 [1040-1048][
摘要
](
5393
)
[
pdf
4676KB]
(
2460
)
DOI:
10.11992/tis.202006055
5
强化学习稀疏奖励算法研究——理论与实验
杨瑞
1
, 严江鹏
1
, 李秀
1,2
2020年5期 [888-899][
摘要
](
6605
)
[
pdf
4915KB]
(
3185
)
DOI:
10.11992/tis.202003031
6
面向多机动态调度问题的两层Q学习算法
王国磊,钟诗胜,林 琳 2009年3期 [239-244][
摘要
](
4450
)
[
pdf
315KB]
(
2706
)
DOI:
7
回报函数学习的学徒学习综述
金卓军,钱? 徽,陈沈轶,朱淼良 2009年3期 [208-212][
摘要
](
6052
)
[
pdf
310KB]
(
4413
)
DOI: