文章

《智能系统学报》过刊查询页面

关键词中包括 reward function 的文章

1	基于分层多智能体强化学习的多无人机视距内空战雍宇晨^1,2, 李子豫³, 董琦² 2025年3期 [548－556][摘要](2373)[pdf 4608KB](4287) DOI:10.11992/tis.202408008

2	基于人工势场的防疫机器人改进近端策略优化算法伍锡如, 沈可扬 2025年3期 [689－698][摘要](1723)[pdf 4889KB](1994) DOI:10.11992/tis.202407026

3	基于改进DDQN船舶自动靠泊路径规划方法李康斌, 朱齐丹, 牟进友, 菅紫婷 2025年1期 [73－80][摘要](3011)[pdf 4790KB](3504) DOI:10.11992/tis.202401005

4	洋流干扰下低速欠驱动AUV的三维路径规划陈世同, 鲁子瑜 2025年2期 [425－434][摘要](2966)[pdf 17308KB](8425) DOI:10.11992/tis.202311004

5	面向多机动态调度问题的两层Q学习算法王国磊，钟诗胜，林琳 2009年3期 [239－244][摘要](5450)[pdf 315KB](3952) DOI:

6	回报函数学习的学徒学习综述金卓军，钱? 徽，陈沈轶，朱淼良 2009年3期 [208－212][摘要](7666)[pdf 310KB](6171) DOI: