《智能系统学报》
过刊查询页面
关键词中包括
reward function
的文章
1
基于分层多智能体强化学习的多无人机视距内空战
雍宇晨
1,2
, 李子豫
3
, 董琦
2
2025年3期 [548-556][
摘要
](
1043
)
[
pdf
4608KB]
(
2120
)
DOI:
10.11992/tis.202408008
2
基于人工势场的防疫机器人改进近端策略优化算法
伍锡如, 沈可扬 2025年3期 [689-698][
摘要
](
862
)
[
pdf
4889KB]
(
1208
)
DOI:
10.11992/tis.202407026
3
基于改进DDQN船舶自动靠泊路径规划方法
李康斌, 朱齐丹, 牟进友, 菅紫婷 2025年1期 [73-80][
摘要
](
1935
)
[
pdf
4790KB]
(
1943
)
DOI:
10.11992/tis.202401005
4
洋流干扰下低速欠驱动AUV的三维路径规划
陈世同, 鲁子瑜 2025年2期 [425-434][
摘要
](
1947
)
[
pdf
17308KB]
(
3251
)
DOI:
10.11992/tis.202311004
5
面向多机动态调度问题的两层Q学习算法
王国磊,钟诗胜,林 琳 2009年3期 [239-244][
摘要
](
5061
)
[
pdf
315KB]
(
3382
)
DOI:
6
回报函数学习的学徒学习综述
金卓军,钱? 徽,陈沈轶,朱淼良 2009年3期 [208-212][
摘要
](
6983
)
[
pdf
310KB]
(
5383
)
DOI: