Flow-of-Options: Диверсифицированное и улучшенное рассуждение в языковых моделях через анализ возможных вариантов
Flow-of-Options: Diversified and Improved LLM Reasoning by Thinking Through Options
February 18, 2025
Авторы: Lakshmi Nair, Ian Trase, Mark Kim
cs.AI
Аннотация
Мы представляем новый подход к рассуждению под названием "Поток вариантов" (Flow-of-Options, FoO), разработанный для устранения внутренних предубеждений в больших языковых моделях (LLM). FoO позволяет LLM систематически исследовать широкий спектр возможностей в процессе рассуждений, что демонстрируется на примере агентной системы на основе FoO для автономного решения задач машинного обучения (AutoML). Наша система превосходит современные базовые методы, показывая улучшения на 38,2% - 69,2% в стандартных задачах анализа данных и на 37,4% - 47,9% в задачах терапевтической химии. При общей стоимости выполнения задачи менее $1 наша система хорошо подходит для приложений, чувствительных к затратам. Помимо классификации и регрессии, мы демонстрируем более широкую применимость нашей агентной системы на основе FoO к задачам, таким как обучение с подкреплением и генерация изображений. Наша система представляет значительные улучшения по сравнению с современными агентными системами для AutoML благодаря преимуществам FoO, которые обеспечивают разнообразие решений LLM через сжатые, объяснимые представления, а также поддерживают долговременную память при комбинировании с рассуждениями на основе прецедентов.
English
We present a novel reasoning approach called Flow-of-Options (FoO), designed
to address intrinsic biases in Large Language Models (LLMs). FoO enables LLMs
to systematically explore a diverse range of possibilities in their reasoning,
as demonstrated by an FoO-based agentic system for autonomously solving Machine
Learning tasks (AutoML). Our framework outperforms state-of-the-art baselines,
achieving improvements of 38.2% - 69.2% on standard data science tasks, and
37.4% - 47.9% on therapeutic chemistry tasks. With an overall operation cost
under $1 per task, our framework is well-suited for cost-sensitive
applications. Beyond classification and regression, we illustrate the broader
applicability of our FoO-based agentic system to tasks such as reinforcement
learning and image generation. Our framework presents significant advancements
compared to current state-of-the-art agentic systems for AutoML, due to the
benefits of FoO in enforcing diversity in LLM solutions through compressed,
explainable representations that also support long-term memory when combined
with case-based reasoning.Summary
AI-Generated Summary