Nutzung der Reasoning-Ökonomie: Ein Überblick über effizientes Reasoning für große Sprachmodelle

papers.abstract

Jüngste Fortschritte bei Large Language Models (LLMs) haben ihre Fähigkeit zur Bewältigung komplexer Denkaufgaben erheblich verbessert, wobei sie sich von schnellem und intuitivem Denken (System 1) zu langsamem und tiefgründigem Denken (System 2) weiterentwickelt haben. Während das System-2-Denken die Genauigkeit bei Aufgaben verbessert, verursacht es aufgrund seiner langsamen Denkweise und ineffizienter oder unnötiger Denkprozesse oft erhebliche Rechenkosten. Im Gegensatz dazu ist das System-1-Denken recheneffizient, führt jedoch zu suboptimalen Ergebnissen. Folglich ist es entscheidend, den Kompromiss zwischen Leistung (Nutzen) und Rechenkosten (Budget) auszubalancieren, was das Konzept der Denkökonomie hervorgebracht hat. In dieser Übersichtsarbeit bieten wir eine umfassende Analyse der Denkökonomie sowohl in der Post-Training- als auch in der Testzeit-Inferenzphase von LLMs, einschließlich i) der Ursachen für Denkineffizienz, ii) der Verhaltensanalyse verschiedener Denkmuster und iii) potenzieller Lösungen zur Erreichung einer Denkökonomie. Durch die Bereitstellung umsetzbarer Erkenntnisse und die Hervorhebung offener Herausforderungen möchten wir Strategien zur Verbesserung der Denkökonomie von LLMs beleuchten und damit als wertvolle Ressource für die Weiterentwicklung der Forschung in diesem sich entwickelnden Bereich dienen. Wir stellen auch ein öffentliches Repository zur Verfügung, um die Entwicklungen in diesem schnelllebigen Feld kontinuierlich zu verfolgen.

English

Recent advancements in Large Language Models (LLMs) have significantly enhanced their ability to perform complex reasoning tasks, transitioning from fast and intuitive thinking (System 1) to slow and deep reasoning (System 2). While System 2 reasoning improves task accuracy, it often incurs substantial computational costs due to its slow thinking nature and inefficient or unnecessary reasoning behaviors. In contrast, System 1 reasoning is computationally efficient but leads to suboptimal performance. Consequently, it is critical to balance the trade-off between performance (benefits) and computational costs (budgets), giving rise to the concept of reasoning economy. In this survey, we provide a comprehensive analysis of reasoning economy in both the post-training and test-time inference stages of LLMs, encompassing i) the cause of reasoning inefficiency, ii) behavior analysis of different reasoning patterns, and iii) potential solutions to achieve reasoning economy. By offering actionable insights and highlighting open challenges, we aim to shed light on strategies for improving the reasoning economy of LLMs, thereby serving as a valuable resource for advancing research in this evolving area. We also provide a public repository to continually track developments in this fast-evolving field.

Nutzung der Reasoning-Ökonomie: Ein Überblick über effizientes Reasoning für große Sprachmodelle

Harnessing the Reasoning Economy: A Survey of Efficient Reasoning for Large Language Models

papers.abstract

Support