Flujo-de-Opciones: Razonamiento Diversificado y Mejorado en LLM al Pensar a Través de Alternativas
Flow-of-Options: Diversified and Improved LLM Reasoning by Thinking Through Options
February 18, 2025
Autores: Lakshmi Nair, Ian Trase, Mark Kim
cs.AI
Resumen
Presentamos un novedoso enfoque de razonamiento llamado Flujo-de-Opciones (Flow-of-Options, FoO), diseñado para abordar los sesgos intrínsecos en los Modelos de Lenguaje de Gran Escala (LLMs). FoO permite a los LLMs explorar sistemáticamente una amplia gama de posibilidades en su razonamiento, como lo demuestra un sistema agente basado en FoO para resolver autónomamente tareas de Aprendizaje Automático (AutoML). Nuestro marco supera a los métodos de referencia más avanzados, logrando mejoras del 38,2% al 69,2% en tareas estándar de ciencia de datos, y del 37,4% al 47,9% en tareas de química terapéutica. Con un costo operativo total inferior a $1 por tarea, nuestro marco es ideal para aplicaciones sensibles a los costos. Más allá de la clasificación y la regresión, ilustramos la aplicabilidad más amplia de nuestro sistema agente basado en FoO a tareas como el aprendizaje por refuerzo y la generación de imágenes. Nuestro marco representa avances significativos en comparación con los sistemas agentes más avanzados actuales para AutoML, gracias a los beneficios de FoO al fomentar la diversidad en las soluciones de los LLMs mediante representaciones comprimidas y explicables que también admiten memoria a largo plazo cuando se combinan con razonamiento basado en casos.
English
We present a novel reasoning approach called Flow-of-Options (FoO), designed
to address intrinsic biases in Large Language Models (LLMs). FoO enables LLMs
to systematically explore a diverse range of possibilities in their reasoning,
as demonstrated by an FoO-based agentic system for autonomously solving Machine
Learning tasks (AutoML). Our framework outperforms state-of-the-art baselines,
achieving improvements of 38.2% - 69.2% on standard data science tasks, and
37.4% - 47.9% on therapeutic chemistry tasks. With an overall operation cost
under $1 per task, our framework is well-suited for cost-sensitive
applications. Beyond classification and regression, we illustrate the broader
applicability of our FoO-based agentic system to tasks such as reinforcement
learning and image generation. Our framework presents significant advancements
compared to current state-of-the-art agentic systems for AutoML, due to the
benefits of FoO in enforcing diversity in LLM solutions through compressed,
explainable representations that also support long-term memory when combined
with case-based reasoning.Summary
AI-Generated Summary