Modelos de Linguagem de Grande Escala para Otimização da Cadeia de Suprimentos

Resumo

As operações da cadeia de suprimentos tradicionalmente envolvem uma variedade de problemas complexos de tomada de decisão. Nas últimas décadas, as cadeias de suprimentos se beneficiaram significativamente dos avanços na computação, o que permitiu a transição do processamento manual para a automação e a otimização de custos. No entanto, os operadores de negócios ainda precisam dedicar esforços consideráveis para explicar e interpretar os resultados da otimização para as partes interessadas. Motivados pelos recentes avanços nos Modelos de Linguagem de Grande Escala (LLMs), estudamos como essa tecnologia disruptiva pode ajudar a preencher a lacuna entre a automação da cadeia de suprimentos e a compreensão e confiança humana nela. Projetamos um framework que aceita como entrada consultas em texto simples e gera insights sobre os resultados subjacentes da otimização. Nosso framework não descarta a tecnologia de otimização combinatória de ponta, mas a utiliza para responder quantitativamente a cenários hipotéticos (por exemplo, como o custo mudaria se usássemos o fornecedor B em vez do fornecedor A para uma determinada demanda?). Importante destacar que nosso design não requer o envio de dados proprietários para os LLMs, o que pode ser uma preocupação de privacidade em algumas circunstâncias. Demonstramos a eficácia do nosso framework em um cenário real de posicionamento de servidores na cadeia de suprimentos de nuvem da Microsoft. Ao longo do processo, desenvolvemos um benchmark de avaliação geral, que pode ser usado para avaliar a precisão da saída do LLM em outros cenários.

English

Supply chain operations traditionally involve a variety of complex decision making problems. Over the last few decades, supply chains greatly benefited from advances in computation, which allowed the transition from manual processing to automation and cost-effective optimization. Nonetheless, business operators still need to spend substantial efforts in explaining and interpreting the optimization outcomes to stakeholders. Motivated by the recent advances in Large Language Models (LLMs), we study how this disruptive technology can help bridge the gap between supply chain automation and human comprehension and trust thereof. We design -- a framework that accepts as input queries in plain text, and outputs insights about the underlying optimization outcomes. Our framework does not forgo the state-of-the-art combinatorial optimization technology, but rather leverages it to quantitatively answer what-if scenarios (e.g., how would the cost change if we used supplier B instead of supplier A for a given demand?). Importantly, our design does not require sending proprietary data over to LLMs, which can be a privacy concern in some circumstances. We demonstrate the effectiveness of our framework on a real server placement scenario within Microsoft's cloud supply chain. Along the way, we develop a general evaluation benchmark, which can be used to evaluate the accuracy of the LLM output in other scenarios.

Modelos de Linguagem de Grande Escala para Otimização da Cadeia de Suprimentos

Large Language Models for Supply Chain Optimization

Resumo

Support