基于多智能体深度强化学习求解分布式异构作业车间动态调度问题

Published in 计算机集成制造系统, 2025

摘要 针对考虑工件动态插入及转移时间的分布式异构作业车间调度问题,以最小化总拖期时间为目标,提出一种基于决斗双深度Q 网络的多智能体深度强化学习(MAD3QN)方法。该问题涉及到工件选择与机器分配两个耦合的决策过程,因此创建了两类智能体,分别为两个智能体制定了两个马尔可夫决策过程。针对工件选择智能体和机器分配智能体,详细描述了两个智能体的状态表示、动作空间和奖励设置,以实现更高效的决策。最后,为了验证所提方法中在不同规模实例下的有效性,与复合调度规则进行了对比;进一步,与启发式调度算法及其他深度强化学习方法相比,验证所提方法在不同规模下的优越性。 ***

关键词 分布式车间;多智能体;动态调度;深度强化学习;


您可以访问文章页获取具体信息: 10.13196/j.cims.2024.0602

Recommended citation: 王丽君,王成广,李相阳,等.基于多智能体深度强化学习求解分布式异构作业车间动态调度问题[J/OL].计算机集成制造系统,1-19[2025-02-26].https://doi.org/10.13196/j.cims.2024.0602.
Download Paper