Использование экономии рассуждений: обзор эффективных методов рассуждений для больших языковых моделей
Harnessing the Reasoning Economy: A Survey of Efficient Reasoning for Large Language Models
March 31, 2025
Авторы: Rui Wang, Hongru Wang, Boyang Xue, Jianhui Pang, Shudong Liu, Yi Chen, Jiahao Qiu, Derek Fai Wong, Heng Ji, Kam-Fai Wong
cs.AI
Аннотация
Последние достижения в области больших языковых моделей (LLM) значительно улучшили их способность выполнять сложные задачи рассуждения, переходя от быстрого и интуитивного мышления (Система 1) к медленному и глубокому анализу (Система 2). Хотя рассуждения Системы 2 повышают точность выполнения задач, они часто сопровождаются значительными вычислительными затратами из-за своей медленной природы и неэффективных или избыточных процессов рассуждения. В то же время рассуждения Системы 1 вычислительно эффективны, но приводят к неоптимальным результатам. Следовательно, крайне важно сбалансировать компромисс между производительностью (выгодами) и вычислительными затратами (бюджетами), что порождает концепцию экономии рассуждений. В данном обзоре мы предоставляем всесторонний анализ экономии рассуждений на этапах пост-обучения и инференции LLM, охватывая i) причины неэффективности рассуждений, ii) анализ поведения различных паттернов рассуждений и iii) потенциальные решения для достижения экономии рассуждений. Предлагая практические рекомендации и выделяя открытые проблемы, мы стремимся осветить стратегии улучшения экономии рассуждений LLM, что послужит ценным ресурсом для продвижения исследований в этой развивающейся области. Мы также предоставляем публичный репозиторий для постоянного отслеживания достижений в этой быстро меняющейся сфере.
English
Recent advancements in Large Language Models (LLMs) have significantly
enhanced their ability to perform complex reasoning tasks, transitioning from
fast and intuitive thinking (System 1) to slow and deep reasoning (System 2).
While System 2 reasoning improves task accuracy, it often incurs substantial
computational costs due to its slow thinking nature and inefficient or
unnecessary reasoning behaviors. In contrast, System 1 reasoning is
computationally efficient but leads to suboptimal performance. Consequently, it
is critical to balance the trade-off between performance (benefits) and
computational costs (budgets), giving rise to the concept of reasoning economy.
In this survey, we provide a comprehensive analysis of reasoning economy in
both the post-training and test-time inference stages of LLMs, encompassing i)
the cause of reasoning inefficiency, ii) behavior analysis of different
reasoning patterns, and iii) potential solutions to achieve reasoning economy.
By offering actionable insights and highlighting open challenges, we aim to
shed light on strategies for improving the reasoning economy of LLMs, thereby
serving as a valuable resource for advancing research in this evolving area. We
also provide a public repository to continually track developments in this
fast-evolving field.Summary
AI-Generated Summary