Flow-of-Options : Raisonnement diversifié et amélioré des LLM en explorant les options
Flow-of-Options: Diversified and Improved LLM Reasoning by Thinking Through Options
February 18, 2025
Auteurs: Lakshmi Nair, Ian Trase, Mark Kim
cs.AI
Résumé
Nous présentons une nouvelle approche de raisonnement appelée Flow-of-Options (FoO), conçue pour traiter les biais intrinsèques des modèles de langage à grande échelle (LLMs). FoO permet aux LLMs d'explorer systématiquement une diversité de possibilités dans leur raisonnement, comme le démontre un système agentique basé sur FoO pour résoudre de manière autonome des tâches d'apprentissage automatique (AutoML). Notre cadre surpasse les meilleures méthodes de référence, obtenant des améliorations de 38,2 % à 69,2 % sur des tâches standards de science des données, et de 37,4 % à 47,9 % sur des tâches de chimie thérapeutique. Avec un coût d'opération global inférieur à 1 dollar par tâche, notre cadre est bien adapté aux applications sensibles aux coûts. Au-delà de la classification et de la régression, nous illustrons l'applicabilité plus large de notre système agentique basé sur FoO à des tâches telles que l'apprentissage par renforcement et la génération d'images. Notre cadre représente des avancées significatives par rapport aux systèmes agentiques actuels pour l'AutoML, grâce aux avantages de FoO dans l'imposition de la diversité des solutions des LLMs à travers des représentations compressées et explicables, qui soutiennent également la mémoire à long terme lorsqu'elles sont combinées avec un raisonnement basé sur les cas.
English
We present a novel reasoning approach called Flow-of-Options (FoO), designed
to address intrinsic biases in Large Language Models (LLMs). FoO enables LLMs
to systematically explore a diverse range of possibilities in their reasoning,
as demonstrated by an FoO-based agentic system for autonomously solving Machine
Learning tasks (AutoML). Our framework outperforms state-of-the-art baselines,
achieving improvements of 38.2% - 69.2% on standard data science tasks, and
37.4% - 47.9% on therapeutic chemistry tasks. With an overall operation cost
under $1 per task, our framework is well-suited for cost-sensitive
applications. Beyond classification and regression, we illustrate the broader
applicability of our FoO-based agentic system to tasks such as reinforcement
learning and image generation. Our framework presents significant advancements
compared to current state-of-the-art agentic systems for AutoML, due to the
benefits of FoO in enforcing diversity in LLM solutions through compressed,
explainable representations that also support long-term memory when combined
with case-based reasoning.Summary
AI-Generated Summary