Echtzeit-Fähige Agenten in sich wandelnden Umgebungen
Real-Time Reasoning Agents in Evolving Environments
November 7, 2025
papers.authors: Yule Wen, Yixin Ye, Yanzhe Zhang, Diyi Yang, Hao Zhu
cs.AI
papers.abstract
Agenten in der realen Welt müssen nicht nur logische, sondern auch zeitkritische Urteile fällen. Dies erfordert ein kontinuierliches Bewusstsein für die dynamische Umgebung: Gefahren entstehen, Chancen ergeben sich und andere Agenten handeln, während der Denkprozess des Agenten noch im Gange ist. Trotz Fortschritten im Sprachmodell-Rasonnement berücksichtigen bestehende Ansätze nicht diese dynamische Natur. Wir führen Echtzeit-Rasonnement als neue Problemformulierung für Agenten in sich entwickelnden Umgebungen ein und entwickeln die Real-Time Reasoning Gym, um dies zu demonstrieren. Wir untersuchen zwei Paradigmen für den Einsatz von Sprachmodellen in Agenten: (1) reaktive Agenten, die Sprachmodelle mit begrenzter Denkberechnung für schnelle Reaktionen einsetzen, und (2) planende Agenten, die erweitertes Rasonnement für komplexe Probleme ermöglichen. Unsere Experimente zeigen, dass selbst modernste Modelle in beiden Paradigmen Schwierigkeiten haben, logische und zeitgerechte Urteile zu fällen. Um diese Einschränkung zu überwinden, schlagen wir AgileThinker vor, das beide Denkparadigmen gleichzeitig anwendet. AgileThinker übertrifft konsequent Agenten, die nur ein Rasonnierparadigma nutzen, wenn die Aufgabenschwierigkeit und der Zeitdruck steigen, und balanciert effektiv Denktiefe und Antwortlatenz. Unsere Arbeit etabliert Echtzeit-Rasonnement als entscheidende Testumgebung für die Entwicklung praktischer Agenten und legt eine Grundlage für die Forschung an zeitlich beschränkten KI-Systemen, die einen Weg zu echtzeitfähigen Agenten aufzeigt.
English
Agents in the real world must make not only logical but also timely
judgments. This requires continuous awareness of the dynamic environment:
hazards emerge, opportunities arise, and other agents act, while the agent's
reasoning is still unfolding. Despite advances in language model reasoning,
existing approaches fail to account for this dynamic nature. We introduce
real-time reasoning as a new problem formulation for agents in evolving
environments and build Real-Time Reasoning Gym to demonstrate it. We study two
paradigms for deploying language models in agents: (1) reactive agents, which
employ language models with bounded reasoning computation for rapid responses,
and (2) planning agents, which allow extended reasoning computation for complex
problems. Our experiments show that even state-of-the-art models struggle with
making logical and timely judgments in either paradigm. To address this
limitation, we propose AgileThinker, which simultaneously engages both
reasoning paradigms. AgileThinker consistently outperforms agents engaging only
one reasoning paradigm as the task difficulty and time pressure rise,
effectively balancing reasoning depth and response latency. Our work
establishes real-time reasoning as a critical testbed for developing practical
agents and provides a foundation for research in temporally constrained AI
systems, highlighting a path toward real-time capable agents.