文章

《智能系统学报》过刊查询页面

关键词中包括 reward 的文章

1	基于改进DDQN船舶自动靠泊路径规划方法李康斌, 朱齐丹, 牟进友, 菅紫婷 2025年1期 [73－80][摘要](1174)[pdf 4790KB](929) DOI:10.11992/tis.202401005

2	洋流干扰下低速欠驱动AUV的三维路径规划陈世同, 鲁子瑜 2025年2期 [425－434][摘要](1086)[pdf 17308KB](2006) DOI:10.11992/tis.202311004

3	规则耦合下的多异构子网络MADDPG博弈对抗算法张钰欣, 赵恩娇, 赵玉新 2024年1期 [190－208][摘要](1741)[pdf 11337KB](1118) DOI:10.11992/tis.202303037

4	基于禁忌搜索的时空众包任务分配算法潘庆先^1,2, 殷增轩², 董红斌¹, 高照龙³, 童向荣² 2020年6期 [1040－1048][摘要](5393)[pdf 4676KB](2460) DOI:10.11992/tis.202006055

5	强化学习稀疏奖励算法研究——理论与实验杨瑞¹, 严江鹏¹, 李秀^1,2 2020年5期 [888－899][摘要](6605)[pdf 4915KB](3185) DOI:10.11992/tis.202003031

6	面向多机动态调度问题的两层Q学习算法王国磊，钟诗胜，林琳 2009年3期 [239－244][摘要](4450)[pdf 315KB](2706) DOI:

7	回报函数学习的学徒学习综述金卓军，钱? 徽，陈沈轶，朱淼良 2009年3期 [208－212][摘要](6052)[pdf 310KB](4413) DOI: