Agents de raisonnement en temps réel dans des environnements évolutifs
Real-Time Reasoning Agents in Evolving Environments
November 7, 2025
papers.authors: Yule Wen, Yixin Ye, Yanzhe Zhang, Diyi Yang, Hao Zhu
cs.AI
papers.abstract
Les agents dans le monde réel doivent produire des jugements non seulement logiques mais aussi opportuns. Cela nécessite une conscience continue de l'environnement dynamique : des dangers émergent, des opportunités apparaissent et d'autres agents agissent, tandis que le raisonnement de l'agent est encore en cours. Malgré les progrès dans le raisonnement des modèles de langage, les approches existantes ne prennent pas en compte cette nature dynamique. Nous introduisons le raisonnement en temps réel comme une nouvelle formulation de problème pour les agents dans des environnements évolutifs et créons Real-Time Reasoning Gym pour le démontrer. Nous étudions deux paradigmes pour déployer des modèles de langage dans des agents : (1) les agents réactifs, qui utilisent des modèles de langage avec un calcul de raisonnement limité pour des réponses rapides, et (2) les agents planificateurs, qui autorisent un calcul de raisonnement étendu pour des problèmes complexes. Nos expériences montrent que même les modèles les plus avancés peinent à produire des jugements logiques et opportuns dans l'un ou l'autre paradigme. Pour remédier à cette limitation, nous proposons AgileThinker, qui mobilise simultanément les deux paradigmes de raisonnement. AgileThinker surpasse constamment les agents n'utilisant qu'un seul paradigme de raisonnement à mesure que la difficulté de la tâche et la pression temporelle augmentent, équilibrant efficacement la profondeur du raisonnement et la latence de réponse. Notre travail établit le raisonnement en temps réel comme un banc d'essai critique pour le développement d'agents pratiques et fournit une base pour la recherche sur les systèmes d'IA soumis à des contraintes temporelles, traçant une voie vers des agents capables d'opérer en temps réel.
English
Agents in the real world must make not only logical but also timely
judgments. This requires continuous awareness of the dynamic environment:
hazards emerge, opportunities arise, and other agents act, while the agent's
reasoning is still unfolding. Despite advances in language model reasoning,
existing approaches fail to account for this dynamic nature. We introduce
real-time reasoning as a new problem formulation for agents in evolving
environments and build Real-Time Reasoning Gym to demonstrate it. We study two
paradigms for deploying language models in agents: (1) reactive agents, which
employ language models with bounded reasoning computation for rapid responses,
and (2) planning agents, which allow extended reasoning computation for complex
problems. Our experiments show that even state-of-the-art models struggle with
making logical and timely judgments in either paradigm. To address this
limitation, we propose AgileThinker, which simultaneously engages both
reasoning paradigms. AgileThinker consistently outperforms agents engaging only
one reasoning paradigm as the task difficulty and time pressure rise,
effectively balancing reasoning depth and response latency. Our work
establishes real-time reasoning as a critical testbed for developing practical
agents and provides a foundation for research in temporally constrained AI
systems, highlighting a path toward real-time capable agents.