《智能系统学报》
过刊查询页面
关键词中包括
policy Gradien t
的文章
1
增强学习中的直接策略搜索方法综述
王学宁
1
, 陈 伟
1
, 张 锰
2
, 徐 昕
1
,? 贺汉根
1
2007年1期 [16-24][
摘要
](
7657
)
[
pdf
504KB]
(
8171
)
DOI: