Agentisches Denken für große Sprachmodelle
Agentic Reasoning for Large Language Models
January 18, 2026
papers.authors: Tianxin Wei, Ting-Wei Li, Zhining Liu, Xuying Ning, Ze Yang, Jiaru Zou, Zhichen Zeng, Ruizhong Qiu, Xiao Lin, Dongqi Fu, Zihao Li, Mengting Ai, Duo Zhou, Wenxuan Bao, Yunzhe Li, Gaotang Li, Cheng Qian, Yu Wang, Xiangru Tang, Yin Xiao, Liri Fang, Hui Liu, Xianfeng Tang, Yuji Zhang, Chi Wang, Jiaxuan You, Heng Ji, Hanghang Tong, Jingrui He
cs.AI
papers.abstract
Logisches Denken ist ein grundlegender kognitiver Prozess, der Inferenz, Problemlösung und Entscheidungsfindung zugrunde liegt. Während große Sprachmodelle (LLMs) in geschlossenen Umgebungen starke Denkfähigkeiten demonstrieren, haben sie in offenen und dynamischen Umgebungen Schwierigkeiten. Agentenbasiertes Denken markiert einen Paradigmenwechsel, indem es LLMs als autonome Agenten neu definiert, die durch kontinuierliche Interaktion planen, handeln und lernen. In diesem Übersichtsartikel strukturieren wir agentenbasiertes Denken entlang drei komplementärer Dimensionen. Erstens charakterisieren wir die Umgebungsdynamik durch drei Ebenen: grundlegendes agentenbasiertes Denken, das Kernfähigkeiten einzelner Agenten etabliert, einschließlich Planung, Werkzeugnutzung und Suche in stabilen Umgebungen; sich selbst entwickelndes agentenbasiertes Denken, das untersucht, wie Agenten diese Fähigkeiten durch Feedback, Gedächtnis und Anpassung verfeinern; und kollektives Multi-Agenten-Denken, das Intelligenz auf kollaborative Settings ausdehnt, die Koordination, Wissensaustausch und gemeinsame Ziele umfassen. Über diese Ebenen hinweg unterscheiden wir In-Context-Denken, das die Interaktion zur Testzeit durch strukturierte Orchestrierung skaliert, von Post-Training-Denken, das Verhalten durch Bestärkendes Lernen und überwachtes Feinabstimmen optimiert. Wir geben weiterhin einen Überblick über repräsentative Frameworks für agentenbasiertes Denken in realen Anwendungen und Benchmarks, einschließlich Wissenschaft, Robotik, Gesundheitswesen, autonomer Forschung und Mathematik. Dieser Übersichtsartikel fasst Methoden des agentenbasierten Denkens zu einem einheitlichen Fahrplan zusammen, der Denken und Handeln verbindet, und skizziert offene Herausforderungen und zukünftige Richtungen, einschließlich Personalisierung, langfristiger Interaktion, Weltmodellierung, skalierbarem Multi-Agenten-Training und Governance für den Einsatz in der realen Welt.
English
Reasoning is a fundamental cognitive process underlying inference, problem-solving, and decision-making. While large language models (LLMs) demonstrate strong reasoning capabilities in closed-world settings, they struggle in open-ended and dynamic environments. Agentic reasoning marks a paradigm shift by reframing LLMs as autonomous agents that plan, act, and learn through continual interaction. In this survey, we organize agentic reasoning along three complementary dimensions. First, we characterize environmental dynamics through three layers: foundational agentic reasoning, which establishes core single-agent capabilities including planning, tool use, and search in stable environments; self-evolving agentic reasoning, which studies how agents refine these capabilities through feedback, memory, and adaptation; and collective multi-agent reasoning, which extends intelligence to collaborative settings involving coordination, knowledge sharing, and shared goals. Across these layers, we distinguish in-context reasoning, which scales test-time interaction through structured orchestration, from post-training reasoning, which optimizes behaviors via reinforcement learning and supervised fine-tuning. We further review representative agentic reasoning frameworks across real-world applications and benchmarks, including science, robotics, healthcare, autonomous research, and mathematics. This survey synthesizes agentic reasoning methods into a unified roadmap bridging thought and action, and outlines open challenges and future directions, including personalization, long-horizon interaction, world modeling, scalable multi-agent training, and governance for real-world deployment.