Modelos de Linguagem de Grande Escala para Otimização da Cadeia de Suprimentos
Large Language Models for Supply Chain Optimization
July 8, 2023
Autores: Beibin Li, Konstantina Mellou, Bo Zhang, Jeevan Pathuri, Ishai Menache
cs.AI
Resumo
As operações da cadeia de suprimentos tradicionalmente envolvem uma variedade de problemas complexos de tomada de decisão. Nas últimas décadas, as cadeias de suprimentos se beneficiaram significativamente dos avanços na computação, o que permitiu a transição do processamento manual para a automação e a otimização de custos. No entanto, os operadores de negócios ainda precisam dedicar esforços consideráveis para explicar e interpretar os resultados da otimização para as partes interessadas. Motivados pelos recentes avanços nos Modelos de Linguagem de Grande Escala (LLMs), estudamos como essa tecnologia disruptiva pode ajudar a preencher a lacuna entre a automação da cadeia de suprimentos e a compreensão e confiança humana nela. Projetamos um framework que aceita como entrada consultas em texto simples e gera insights sobre os resultados subjacentes da otimização. Nosso framework não descarta a tecnologia de otimização combinatória de ponta, mas a utiliza para responder quantitativamente a cenários hipotéticos (por exemplo, como o custo mudaria se usássemos o fornecedor B em vez do fornecedor A para uma determinada demanda?). Importante destacar que nosso design não requer o envio de dados proprietários para os LLMs, o que pode ser uma preocupação de privacidade em algumas circunstâncias. Demonstramos a eficácia do nosso framework em um cenário real de posicionamento de servidores na cadeia de suprimentos de nuvem da Microsoft. Ao longo do processo, desenvolvemos um benchmark de avaliação geral, que pode ser usado para avaliar a precisão da saída do LLM em outros cenários.
English
Supply chain operations traditionally involve a variety of complex decision
making problems. Over the last few decades, supply chains greatly benefited
from advances in computation, which allowed the transition from manual
processing to automation and cost-effective optimization. Nonetheless, business
operators still need to spend substantial efforts in explaining and
interpreting the optimization outcomes to stakeholders. Motivated by the recent
advances in Large Language Models (LLMs), we study how this disruptive
technology can help bridge the gap between supply chain automation and human
comprehension and trust thereof. We design -- a framework that accepts
as input queries in plain text, and outputs insights about the underlying
optimization outcomes. Our framework does not forgo the state-of-the-art
combinatorial optimization technology, but rather leverages it to
quantitatively answer what-if scenarios (e.g., how would the cost change if we
used supplier B instead of supplier A for a given demand?). Importantly, our
design does not require sending proprietary data over to LLMs, which can be a
privacy concern in some circumstances. We demonstrate the effectiveness of our
framework on a real server placement scenario within Microsoft's cloud supply
chain. Along the way, we develop a general evaluation benchmark, which can be
used to evaluate the accuracy of the LLM output in other scenarios.