Real-Time Redeneeragenten in Evoluerende Omgevingen
Real-Time Reasoning Agents in Evolving Environments
November 7, 2025
Auteurs: Yule Wen, Yixin Ye, Yanzhe Zhang, Diyi Yang, Hao Zhu
cs.AI
Samenvatting
Agentia in de echte wereld moeten niet alleen logische, maar ook tijdige oordelen vellen. Dit vereist een voortdurend bewustzijn van de dynamische omgeving: gevaren dienen zich aan, kansen ontstaan, en andere agenten handelen, terwijl het redeneerproces van de agent zelf nog gaande is. Ondanks vooruitgang in redeneermodellen voor taalmodellen, houden bestaande benaderingen geen rekening met deze dynamische aard. Wij introduceren real-time redeneren als een nieuwe probleemformulering voor agentia in evoluerende omgevingen en ontwikkelen de Real-Time Reasoning Gym om dit te demonstreren. Wij bestuderen twee paradigma's voor het inzetten van taalmodellen in agentia: (1) reactieve agentia, die taalmodellen gebruiken met een begrensde rekenkracht voor redeneren om snel te kunnen reageren, en (2) plannende agentia, die uitgebreide rekenkracht voor redeneren toestaan voor complexe problemen. Onze experimenten tonen aan dat zelfs state-of-the-art modellen moeite hebben met het vellen van logische en tijdige oordelen in beide paradigma's. Om deze beperking aan te pakken, stellen wij AgileThinker voor, dat beide redeneerparadigma's gelijktijdig activeert. AgileThinker presteert consistent beter dan agentia die slechts één redeneerparadigma gebruiken naarmate de taakmoeilijkheid en tijdsdruk toenemen, en balanceert effectief tussen redeneerdiepte en reactielatentie. Ons werk vestigt real-time redeneren als een kritieke testomgeving voor de ontwikkeling van praktische agentia en biedt een basis voor onderzoek naar temporeel beperkte AI-systemen, waarbij het een pad naarst richting real-time capabele agentia belicht.
English
Agents in the real world must make not only logical but also timely
judgments. This requires continuous awareness of the dynamic environment:
hazards emerge, opportunities arise, and other agents act, while the agent's
reasoning is still unfolding. Despite advances in language model reasoning,
existing approaches fail to account for this dynamic nature. We introduce
real-time reasoning as a new problem formulation for agents in evolving
environments and build Real-Time Reasoning Gym to demonstrate it. We study two
paradigms for deploying language models in agents: (1) reactive agents, which
employ language models with bounded reasoning computation for rapid responses,
and (2) planning agents, which allow extended reasoning computation for complex
problems. Our experiments show that even state-of-the-art models struggle with
making logical and timely judgments in either paradigm. To address this
limitation, we propose AgileThinker, which simultaneously engages both
reasoning paradigms. AgileThinker consistently outperforms agents engaging only
one reasoning paradigm as the task difficulty and time pressure rise,
effectively balancing reasoning depth and response latency. Our work
establishes real-time reasoning as a critical testbed for developing practical
agents and provides a foundation for research in temporally constrained AI
systems, highlighting a path toward real-time capable agents.