Modelos de Lenguaje a Gran Escala para la Optimización de la Cadena de Suministro
Large Language Models for Supply Chain Optimization
July 8, 2023
Autores: Beibin Li, Konstantina Mellou, Bo Zhang, Jeevan Pathuri, Ishai Menache
cs.AI
Resumen
Las operaciones de la cadena de suministro tradicionalmente involucran una variedad de problemas complejos de toma de decisiones. Durante las últimas décadas, las cadenas de suministro se han beneficiado enormemente de los avances en computación, lo que permitió la transición del procesamiento manual a la automatización y la optimización rentable. Sin embargo, los operadores empresariales aún necesitan dedicar esfuerzos considerables para explicar e interpretar los resultados de la optimización a las partes interesadas. Motivados por los recientes avances en los Modelos de Lenguaje de Gran Escala (LLMs, por sus siglas en inglés), estudiamos cómo esta tecnología disruptiva puede ayudar a cerrar la brecha entre la automatización de la cadena de suministro y la comprensión y confianza humana en la misma. Diseñamos un marco de trabajo que acepta como entrada consultas en texto plano y genera información sobre los resultados subyacentes de la optimización. Nuestro marco de trabajo no prescinde de la tecnología de optimización combinatoria de última generación, sino que la aprovecha para responder cuantitativamente a escenarios hipotéticos (por ejemplo, ¿cómo cambiaría el costo si utilizáramos al proveedor B en lugar del proveedor A para una demanda dada?). Es importante destacar que nuestro diseño no requiere enviar datos propietarios a los LLMs, lo que puede ser una preocupación de privacidad en algunas circunstancias. Demostramos la efectividad de nuestro marco de trabajo en un escenario real de colocación de servidores dentro de la cadena de suministro en la nube de Microsoft. En el proceso, desarrollamos un punto de referencia de evaluación general, que puede utilizarse para evaluar la precisión de la salida del LLM en otros escenarios.
English
Supply chain operations traditionally involve a variety of complex decision
making problems. Over the last few decades, supply chains greatly benefited
from advances in computation, which allowed the transition from manual
processing to automation and cost-effective optimization. Nonetheless, business
operators still need to spend substantial efforts in explaining and
interpreting the optimization outcomes to stakeholders. Motivated by the recent
advances in Large Language Models (LLMs), we study how this disruptive
technology can help bridge the gap between supply chain automation and human
comprehension and trust thereof. We design -- a framework that accepts
as input queries in plain text, and outputs insights about the underlying
optimization outcomes. Our framework does not forgo the state-of-the-art
combinatorial optimization technology, but rather leverages it to
quantitatively answer what-if scenarios (e.g., how would the cost change if we
used supplier B instead of supplier A for a given demand?). Importantly, our
design does not require sending proprietary data over to LLMs, which can be a
privacy concern in some circumstances. We demonstrate the effectiveness of our
framework on a real server placement scenario within Microsoft's cloud supply
chain. Along the way, we develop a general evaluation benchmark, which can be
used to evaluate the accuracy of the LLM output in other scenarios.