Die Ära der agentiven Organisation: Lernen zu organisieren mit Sprachmodellen
The Era of Agentic Organization: Learning to Organize with Language Models
October 30, 2025
papers.authors: Zewen Chi, Li Dong, Qingxiu Dong, Yaru Hao, Xun Wu, Shaohan Huang, Furu Wei
cs.AI
papers.abstract
Wir stellen uns eine neue Ära der KI vor, die als agentische Organisation bezeichnet wird, in der Agenten komplexe Probleme durch kollaborative und parallele Zusammenarbeit lösen und damit Ergebnisse jenseits individueller Intelligenz ermöglichen. Um diese Vision zu verwirklichen, führen wir asynchrones Denken (AsyncThink) als neues Paradigma des Schlussfolgerns mit großen Sprachmodellen ein, das den internen Denkprozess in parallel ausführbare Strukturen organisiert. Konkret schlagen wir ein Denkprotokoll vor, bei dem ein Organisator dynamisch Teilfragen an Arbeiter verteilt, Zwischenwissen zusammenführt und kohärente Lösungen erzeugt. Noch wichtiger ist, dass die Denkstruktur in diesem Protokoll durch Reinforcement Learning weiter optimiert werden kann. Experimente zeigen, dass AsyncThink im Vergleich zu parallelem Denken eine um 28 % geringere Inferenzlatenz erreicht und gleichzeitig die Genauigkeit beim mathematischen Schlussfolgern verbessert. Darüber hinaus verallgemeinert AsyncThink seine erlernten asynchronen Denkfähigkeiten und bewältigt effektiv unbekannte Aufgaben ohne zusätzliches Training.
English
We envision a new era of AI, termed agentic organization, where agents solve
complex problems by working collaboratively and concurrently, enabling outcomes
beyond individual intelligence. To realize this vision, we introduce
asynchronous thinking (AsyncThink) as a new paradigm of reasoning with large
language models, which organizes the internal thinking process into
concurrently executable structures. Specifically, we propose a thinking
protocol where an organizer dynamically assigns sub-queries to workers, merges
intermediate knowledge, and produces coherent solutions. More importantly, the
thinking structure in this protocol can be further optimized through
reinforcement learning. Experiments demonstrate that AsyncThink achieves 28%
lower inference latency compared to parallel thinking while improving accuracy
on mathematical reasoning. Moreover, AsyncThink generalizes its learned
asynchronous thinking capabilities, effectively tackling unseen tasks without
additional training.