文章

《智能系统学报》过刊查询页面

关键词中包括 reward 的文章

1	基于分层多智能体强化学习的多无人机视距内空战雍宇晨^1,2, 李子豫³, 董琦² 2025年3期 [548－556][摘要](2161)[pdf 4608KB](3798) DOI:10.11992/tis.202408008

2	基于人工势场的防疫机器人改进近端策略优化算法伍锡如, 沈可扬 2025年3期 [689－698][摘要](1609)[pdf 4889KB](1859) DOI:10.11992/tis.202407026

3	基于改进DDQN船舶自动靠泊路径规划方法李康斌, 朱齐丹, 牟进友, 菅紫婷 2025年1期 [73－80][摘要](2889)[pdf 4790KB](3257) DOI:10.11992/tis.202401005

4	洋流干扰下低速欠驱动AUV的三维路径规划陈世同, 鲁子瑜 2025年2期 [425－434][摘要](2745)[pdf 17308KB](8198) DOI:10.11992/tis.202311004

5	规则耦合下的多异构子网络MADDPG博弈对抗算法张钰欣, 赵恩娇, 赵玉新 2024年1期 [190－208][摘要](3131)[pdf 11337KB](2971) DOI:10.11992/tis.202303037

6	基于禁忌搜索的时空众包任务分配算法潘庆先^1,2, 殷增轩², 董红斌¹, 高照龙³, 童向荣² 2020年6期 [1040－1048][摘要](6459)[pdf 4676KB](3583) DOI:10.11992/tis.202006055

7	强化学习稀疏奖励算法研究——理论与实验杨瑞¹, 严江鹏¹, 李秀^1,2 2020年5期 [888－899][摘要](8261)[pdf 4915KB](4620) DOI:10.11992/tis.202003031

8	面向多机动态调度问题的两层Q学习算法王国磊，钟诗胜，林琳 2009年3期 [239－244][摘要](5376)[pdf 315KB](3801) DOI:

9	回报函数学习的学徒学习综述金卓军，钱? 徽，陈沈轶，朱淼良 2009年3期 [208－212][摘要](7572)[pdf 310KB](6029) DOI: