Exploiter l'économie du raisonnement : Un panorama des méthodes de raisonnement efficace pour les grands modèles de langage
Harnessing the Reasoning Economy: A Survey of Efficient Reasoning for Large Language Models
March 31, 2025
Auteurs: Rui Wang, Hongru Wang, Boyang Xue, Jianhui Pang, Shudong Liu, Yi Chen, Jiahao Qiu, Derek Fai Wong, Heng Ji, Kam-Fai Wong
cs.AI
Résumé
Les récents progrès des modèles de langage à grande échelle (LLMs) ont considérablement amélioré leur capacité à effectuer des tâches de raisonnement complexes, passant d'une pensée rapide et intuitive (Système 1) à un raisonnement lent et approfondi (Système 2). Bien que le raisonnement de type Système 2 améliore la précision des tâches, il engendre souvent des coûts computationnels importants en raison de sa nature de pensée lente et de comportements de raisonnement inefficaces ou superflus. En revanche, le raisonnement de type Système 1 est computationnellement efficace, mais conduit à des performances sous-optimales. Par conséquent, il est crucial de trouver un équilibre entre les performances (avantages) et les coûts computationnels (budgets), donnant ainsi naissance au concept d'économie de raisonnement. Dans cette étude, nous proposons une analyse approfondie de l'économie de raisonnement aux étapes de post-entraînement et d'inférence en temps réel des LLMs, englobant i) les causes de l'inefficacité du raisonnement, ii) l'analyse des comportements des différents modèles de raisonnement, et iii) les solutions potentielles pour atteindre une économie de raisonnement. En offrant des perspectives exploitables et en mettant en lumière les défis ouverts, nous visons à éclairer les stratégies pour améliorer l'économie de raisonnement des LLMs, servant ainsi de ressource précieuse pour faire progresser la recherche dans ce domaine en évolution. Nous mettons également à disposition un référentiel public pour suivre continuellement les développements dans ce domaine en rapide mutation.
English
Recent advancements in Large Language Models (LLMs) have significantly
enhanced their ability to perform complex reasoning tasks, transitioning from
fast and intuitive thinking (System 1) to slow and deep reasoning (System 2).
While System 2 reasoning improves task accuracy, it often incurs substantial
computational costs due to its slow thinking nature and inefficient or
unnecessary reasoning behaviors. In contrast, System 1 reasoning is
computationally efficient but leads to suboptimal performance. Consequently, it
is critical to balance the trade-off between performance (benefits) and
computational costs (budgets), giving rise to the concept of reasoning economy.
In this survey, we provide a comprehensive analysis of reasoning economy in
both the post-training and test-time inference stages of LLMs, encompassing i)
the cause of reasoning inefficiency, ii) behavior analysis of different
reasoning patterns, and iii) potential solutions to achieve reasoning economy.
By offering actionable insights and highlighting open challenges, we aim to
shed light on strategies for improving the reasoning economy of LLMs, thereby
serving as a valuable resource for advancing research in this evolving area. We
also provide a public repository to continually track developments in this
fast-evolving field.Summary
AI-Generated Summary