文章

关键词中包括 reward 的文章

1	规则耦合下的多异构子网络MADDPG博弈对抗算法张钰欣, 赵恩娇, 赵玉新 2024年1期 [190－208][摘要](195)[pdf 11337KB](141) DOI:10.11992/tis.202303037

2	基于禁忌搜索的时空众包任务分配算法潘庆先^1,2, 殷增轩², 董红斌¹, 高照龙³, 童向荣² 2020年6期 [1040－1048][摘要](4494)[pdf 4676KB](1473) DOI:10.11992/tis.202006055

3	强化学习稀疏奖励算法研究——理论与实验杨瑞¹, 严江鹏¹, 李秀^1,2 2020年5期 [888－899][摘要](5175)[pdf 4915KB](1911) DOI:10.11992/tis.202003031

4	面向多机动态调度问题的两层Q学习算法王国磊，钟诗胜，林琳 2009年3期 [239－244][摘要](3714)[pdf 315KB](2049) DOI:

5	回报函数学习的学徒学习综述金卓军，钱? 徽，陈沈轶，朱淼良 2009年3期 [208－212][摘要](5036)[pdf 310KB](3490) DOI: