基于多智能体深度强化学习求解分布式异构作业车间动态调度问题

Published in 计算机集成制造系统, 2025

摘要针对考虑工件动态插入及转移时间的分布式异构作业车间调度问题，以最小化总拖期时间为目标，提出一种基于决斗双深度Q 网络的多智能体深度强化学习（MAD3QN）方法。该问题涉及到工件选择与机器分配两个耦合的决策过程，因此创建了两类智能体，分别为两个智能体制定了两个马尔可夫决策过程。针对工件选择智能体和机器分配智能体，详细描述了两个智能体的状态表示、动作空间和奖励设置，以实现更高效的决策。最后，为了验证所提方法中在不同规模实例下的有效性，与复合调度规则进行了对比；进一步，与启发式调度算法及其他深度强化学习方法相比，验证所提方法在不同规模下的优越性。 ***

关键词 分布式车间;多智能体;动态调度;深度强化学习;

您可以访问文章页获取具体信息： 10.13196/j.cims.2024.0602

Recommended citation: 王丽君,王成广,李相阳,等.基于多智能体深度强化学习求解分布式异构作业车间动态调度问题[J/OL].计算机集成制造系统,1-19[2025-02-26].https://doi.org/10.13196/j.cims.2024.0602.
Download Paper

Share on

X (formerly Twitter) Facebook LinkedIn

李相阳(Xiangyang Li)

Share on