《智能系统学报》
过刊查询页面
关键词中包括
reward
的文章
1
规则耦合下的多异构子网络MADDPG博弈对抗算法
张钰欣, 赵恩娇, 赵玉新 2024年1期 [190-208][
摘要
](
939
)
[
pdf
11337KB]
(
660
)
DOI:
10.11992/tis.202303037
2
基于禁忌搜索的时空众包任务分配算法
潘庆先
1,2
, 殷增轩
2
, 董红斌
1
, 高照龙
3
, 童向荣
2
2020年6期 [1040-1048][
摘要
](
4906
)
[
pdf
4676KB]
(
2084
)
DOI:
10.11992/tis.202006055
3
强化学习稀疏奖励算法研究——理论与实验
杨瑞
1
, 严江鹏
1
, 李秀
1,2
2020年5期 [888-899][
摘要
](
5982
)
[
pdf
4915KB]
(
2656
)
DOI:
10.11992/tis.202003031
4
面向多机动态调度问题的两层Q学习算法
王国磊,钟诗胜,林 琳 2009年3期 [239-244][
摘要
](
4061
)
[
pdf
315KB]
(
2421
)
DOI:
5
回报函数学习的学徒学习综述
金卓军,钱? 徽,陈沈轶,朱淼良 2009年3期 [208-212][
摘要
](
5482
)
[
pdf
310KB]
(
3963
)
DOI: