《智能系统学报》 过刊查询页面

    关键词中包括 reward 的文章

1 基于分层多智能体强化学习的多无人机视距内空战
雍宇晨1,2, 李子豫3, 董琦2 2025年3期 [548-556][摘要](1194)[pdf 4608KB](2507)
2 基于人工势场的防疫机器人改进近端策略优化算法
伍锡如, 沈可扬 2025年3期 [689-698][摘要](1030)[pdf 4889KB](1375)
3 基于改进DDQN船舶自动靠泊路径规划方法
李康斌, 朱齐丹, 牟进友, 菅紫婷 2025年1期 [73-80][摘要](2137)[pdf 4790KB](2038)
4 洋流干扰下低速欠驱动AUV的三维路径规划
陈世同, 鲁子瑜 2025年2期 [425-434][摘要](2117)[pdf 17308KB](3355)
5 规则耦合下的多异构子网络MADDPG博弈对抗算法
张钰欣, 赵恩娇, 赵玉新 2024年1期 [190-208][摘要](2674)[pdf 11337KB](2264)
6 基于禁忌搜索的时空众包任务分配算法
潘庆先1,2, 殷增轩2, 董红斌1, 高照龙3, 童向荣2 2020年6期 [1040-1048][摘要](6075)[pdf 4676KB](3245)
7 强化学习稀疏奖励算法研究——理论与实验
杨瑞1, 严江鹏1, 李秀1,2 2020年5期 [888-899][摘要](7573)[pdf 4915KB](4157)
8 面向多机动态调度问题的两层Q学习算法
王国磊,钟诗胜,林 琳 2009年3期 [239-244][摘要](5142)[pdf 315KB](3530)
DOI:
9 回报函数学习的学徒学习综述
金卓军,钱? 徽,陈沈轶,朱淼良 2009年3期 [208-212][摘要](7152)[pdf 310KB](5575)
DOI: