《智能系统学报》 过刊查询页面

    关键词中包括 reward function 的文章

1 面向多机动态调度问题的两层Q学习算法
王国磊,钟诗胜,林 琳 2009年3期 [239-244][摘要](4061)[pdf 315KB](2421)
DOI:
2 回报函数学习的学徒学习综述
金卓军,钱? 徽,陈沈轶,朱淼良 2009年3期 [208-212][摘要](5482)[pdf 310KB](3963)
DOI: