微软亚洲研究院提出将LLM应用于工业控制,实现空调的直接控制

微软亚洲研究院提出了一种使用预训练的大型语言模型LLM)进行工业控制的方法,通过使用 GPT-4模型来控制空气调节系统(HVAC)。该方法仅需少量示例样本就能达到优于传统强化学习方法的效果。传统的强化学习方法在处理异构任务、样本低效以及在线适应新场景等方面存在问题,而使用预训练 LLM 可以作为解决方案。微软亚洲研究院提出将LLM应用于工业控制,实现空调的直接控制

该研究在交互环境中进行实验,得到了积极的实验结果。研究者还进行了消融研究,以确定不同部分在控制任务中的贡献。该研究的目标是探索直接使用预训练 LLM 进行工业控制任务的潜力,以及设计解决技术债较低的工业控制任务的方法。

这篇论文的主要贡献包括:

* 开发了一种可将基础模型用于工业控制但无需训练的方法,其能以较低的技术债用于多种异构的任务。
* 研究者通过使用 GPT-4控制 HVAC 进行了实验,得到了积极的实验结果,展现了这些方法的潜力。
* 研究者进行了广泛的消融研究(涉及泛化能力、示例选取和 prompt 设计),阐明了该方向的未来发展。

相关论文链接:https://export.arxiv.org/abs/2308.03028

暂无评论

暂无评论...