《智能系统学报》 过刊查询页面

    关键词中包括 reward function 的文章

1 基于改进DDQN船舶自动靠泊路径规划方法
李康斌, 朱齐丹, 牟进友, 菅紫婷 2025年1期 [73-80][摘要](916)[pdf 4790KB](696)
2 洋流干扰下低速欠驱动AUV的三维路径规划
陈世同, 鲁子瑜 2025年2期 [425-434][摘要](513)[pdf 17308KB](625)
3 面向多机动态调度问题的两层Q学习算法
王国磊,钟诗胜,林 琳 2009年3期 [239-244][摘要](4316)[pdf 315KB](2612)
DOI:
4 回报函数学习的学徒学习综述
金卓军,钱? 徽,陈沈轶,朱淼良 2009年3期 [208-212][摘要](5867)[pdf 310KB](4258)
DOI: