基于大语言模型和深度强化学习的柔性作业车间动态调度问题研究
Published in 计算机集成制造系统, 2025
摘要 针对工件动态插入的柔性作业车间动态调度问题,以最小化总延期时间为目标,提出一种将大语言模型(LLM)与深度强化学习(DRL)结合的LLM-DQN算法。通过将LLM的语义理解能力与深度Q网络(DQN)相结合,构建了包含状态空间优化、混合动作选择和奖励函数设计的集成框架。在状态表示方面,利用LLM生成加权特征向量以突出关键调度指标;在动作选择阶段,设计混合策略实现LLM专家建议与DQN策略的动态融合;同时引入LLM驱动的自适应奖励机制。在DeepSeek和Doubao 等大语言模型上的仿真实验表明,LLM-DQN在多种测试场景下优于单一调度动作及其他深度强化学习方法。 ***
关键词 大语言模型;深度强化学习;柔性作业车间;动态调度;
您可以访问文章页获取具体信息: 10.13196/j.cims.2024.Z36
Recommended citation: 王丽君,王成广,李相阳,等.基于大语言模型和深度强化学习的柔性作业车间动态调度问题研究[J/OL].计算机集成制造系统,1-21[2025-10-20].https://doi.org/10.13196/j.cims.2024.Z36.
Download Paper
