[1]王国磊,钟诗胜,林 琳.面向多机动态调度问题的两层Q学习算法[J].智能系统学报,2009,4(3):239-244.
WANG Guo-lei,ZHONG Shi-sheng,LIN Lin.Bilevel Qlearning algorithm for dynamic multimachinescheduling problems[J].CAAI Transactions on Intelligent Systems,2009,4(3):239-244.
点击复制
《智能系统学报》[ISSN 1673-4785/CN 23-1538/TP] 卷:
4
期数:
2009年第3期
页码:
239-244
栏目:
学术论文—智能系统
出版日期:
2009-06-25
- Title:
-
Bilevel Qlearning algorithm for dynamic multimachinescheduling problems
- 文章编号:
-
1673-4785(2009)03-0239-06
- 作者:
-
王国磊,钟诗胜,林 琳
-
哈尔滨工业大学 机电工程学院,黑龙江 哈尔滨 150001
- Author(s):
-
WANG Guo-lei, ZHONG Shi-sheng, LIN Lin
-
School of Mechanical Engineering, Harbin Institute of Technology, Harbin 150001, China
-
- 关键词:
-
动态多机调度; Q学习; 动作集; 状态空间划分; 奖惩函数
- Keywords:
-
dynamic multimachine scheduling; Qlearning; action set; state space division; reward function
- 分类号:
-
TP273
- 文献标志码:
-
A
- 摘要:
-
对于单机动态调度问题十分有效的Q学习,在多机动态调度环境下却由于缺乏全局眼光而效果欠佳,因此提出了一种双层Q学习算法.底层Q学习着眼于局部,以最小化设备空闲和作业平均流经时间为目标,学习单机调度策略;而顶层Q学习则着眼于全局,以平衡机器负载、最小化整体拖期值为目标,学习如何分配作业到合适机器.文中分别给出了两层Q学习的动作集、状态空间划分方式和奖惩函数设计,并通过对多机动态调度问题的仿真实验表明,提出的双层Q学习能够很好地解决改善动态环境下多机调度问题.
- Abstract:
-
Traditional Qlearning is very effective in dynamic singlemachine scheduling problems, yet sometimes it cannot get optimal results for dynamic multimachine scheduling problems due to its lack of global vision. To resolve this, a twolayer Qlearning algorithm was put forward. The bottomlevel of Qlearning was focused on localized targets in order to learn the optimal scheduling policy which can minimize machine idleness and the mean flow time of single machines. On the other hand, the toplevel of Qlearning was focused on global targets in order to find the dispatching policy which can balance machine loads and minimize the overall tardiness of all jobs. The scheduling and dispatching rules of agents, the method for dividing state space and the reward functions were all examined. Simulation results showed that the proposed twolayer Qlearning algorithm can improve the results of dynamic multimachine scheduling problems.
备注/Memo
收稿日期:2008-10-03.
基金项目:国家“863”计划资助项目(2008AA04Z401).
通信作者:王国磊. E-mail: Wanggl_hit@163.com.
作者简介:王国磊,男,1982年生,博士研究生.主要研究方向为生产计划和车间调度等,发表学术论文10余篇.
钟诗胜,男,1964年生,教授,博士生导师.哈尔滨工业大学威海分校副校长、中国机械工程学会机械设计分会理事、中国人工智能学会可拓学专业委员会常务理事、中国工程图学学会应用图学专业委员会委员、全国工业自动化系统与集成标准化技术委员会委员、国防科工委信息技术应用标准化技术委员会委员.主要研究方向为数字化设计与制造、人工智能理论与应用、数控设备研发等.国家863/CIMS重大应用示范工程项目——“HEC-CIMS II工程”的副总设计师,主持国家自然科学基金项目2项、国家863计划项目2项,参与国家863计划项目1项、国家自然科学基金项目1项,承担欧盟科技计划项目(英国、中国、西班牙联合承担)1项,多项省(部)级科技项目和企业横向项目.曾获省部级科技进步二等奖1项、三等奖2项,专利1个和国家自主版权登记软件3套,被评为黑龙江省CIMS应用示范先进个人.发表学术论文140余篇,出版专著1部.
林 琳,女,1973年生,副教授,硕士生导师.主要研究方向为智能设计和产品数据管理等.发表学术论文20余篇.
更新日期/Last Update:
2009-08-31