Agentes de Raciocínio em Tempo Real em Ambientes em Evolução
Real-Time Reasoning Agents in Evolving Environments
November 7, 2025
Autores: Yule Wen, Yixin Ye, Yanzhe Zhang, Diyi Yang, Hao Zhu
cs.AI
Resumo
Os agentes no mundo real precisam fazer julgamentos não apenas lógicos, mas também oportunos. Isso exige uma consciência contínua do ambiente dinâmico: perigos emergem, oportunidades surgem e outros agentes agem, enquanto o raciocínio do agente ainda está em desenvolvimento. Apesar dos avanços no raciocínio de modelos de linguagem, as abordagens existentes não conseguem considerar essa natureza dinâmica. Introduzimos o raciocínio em tempo real como uma nova formulação de problema para agentes em ambientes em evolução e construímos o Real-Time Reasoning Gym para demonstrá-lo. Estudamos dois paradigmas para implantar modelos de linguagem em agentes: (1) agentes reativos, que empregam modelos de linguagem com computação de raciocínio limitada para respostas rápidas, e (2) agentes de planejamento, que permitem computação de raciocínio estendida para problemas complexos. Nossos experimentos mostram que mesmo os modelos mais avançados lutam para fazer julgamentos lógicos e oportunos em qualquer um dos paradigmas. Para superar essa limitação, propomos o AgileThinker, que engaja simultaneamente ambos os paradigmas de raciocínio. O AgileThinker supera consistentemente os agentes que utilizam apenas um paradigma de raciocínio à medida que a dificuldade da tarefa e a pressão temporal aumentam, equilibrando efetivamente a profundidade do raciocínio e a latência de resposta. Nosso trabalho estabelece o raciocínio em tempo real como um campo de testes crítico para o desenvolvimento de agentes práticos e fornece uma base para pesquisas em sistemas de IA com restrições temporais, destacando um caminho para agentes capacitados para atuação em tempo real.
English
Agents in the real world must make not only logical but also timely
judgments. This requires continuous awareness of the dynamic environment:
hazards emerge, opportunities arise, and other agents act, while the agent's
reasoning is still unfolding. Despite advances in language model reasoning,
existing approaches fail to account for this dynamic nature. We introduce
real-time reasoning as a new problem formulation for agents in evolving
environments and build Real-Time Reasoning Gym to demonstrate it. We study two
paradigms for deploying language models in agents: (1) reactive agents, which
employ language models with bounded reasoning computation for rapid responses,
and (2) planning agents, which allow extended reasoning computation for complex
problems. Our experiments show that even state-of-the-art models struggle with
making logical and timely judgments in either paradigm. To address this
limitation, we propose AgileThinker, which simultaneously engages both
reasoning paradigms. AgileThinker consistently outperforms agents engaging only
one reasoning paradigm as the task difficulty and time pressure rise,
effectively balancing reasoning depth and response latency. Our work
establishes real-time reasoning as a critical testbed for developing practical
agents and provides a foundation for research in temporally constrained AI
systems, highlighting a path toward real-time capable agents.