《智能系统学报》
过刊查询页面
关键词中包括
reward function
的文章
1
面向多机动态调度问题的两层Q学习算法
王国磊,钟诗胜,林 琳 2009年3期 [239-244][
摘要
](
4061
)
[
pdf
315KB]
(
2421
)
DOI:
2
回报函数学习的学徒学习综述
金卓军,钱? 徽,陈沈轶,朱淼良 2009年3期 [208-212][
摘要
](
5482
)
[
pdf
310KB]
(
3963
)
DOI: