《智能系统学报》 过刊查询页面

    关键词中包括 policy Gradien t 的文章

1 增强学习中的直接策略搜索方法综述
王学宁1, 陈 伟1, 张 锰2, 徐 昕1,? 贺汉根1 2007年1期 [16-24][摘要](7478)[pdf 504KB](7945)
DOI: