Agentes de Raciocínio em Tempo Real em Ambientes em Evolução

Resumo

Os agentes no mundo real precisam fazer julgamentos não apenas lógicos, mas também oportunos. Isso exige uma consciência contínua do ambiente dinâmico: perigos emergem, oportunidades surgem e outros agentes agem, enquanto o raciocínio do agente ainda está em desenvolvimento. Apesar dos avanços no raciocínio de modelos de linguagem, as abordagens existentes não conseguem considerar essa natureza dinâmica. Introduzimos o raciocínio em tempo real como uma nova formulação de problema para agentes em ambientes em evolução e construímos o Real-Time Reasoning Gym para demonstrá-lo. Estudamos dois paradigmas para implantar modelos de linguagem em agentes: (1) agentes reativos, que empregam modelos de linguagem com computação de raciocínio limitada para respostas rápidas, e (2) agentes de planejamento, que permitem computação de raciocínio estendida para problemas complexos. Nossos experimentos mostram que mesmo os modelos mais avançados lutam para fazer julgamentos lógicos e oportunos em qualquer um dos paradigmas. Para superar essa limitação, propomos o AgileThinker, que engaja simultaneamente ambos os paradigmas de raciocínio. O AgileThinker supera consistentemente os agentes que utilizam apenas um paradigma de raciocínio à medida que a dificuldade da tarefa e a pressão temporal aumentam, equilibrando efetivamente a profundidade do raciocínio e a latência de resposta. Nosso trabalho estabelece o raciocínio em tempo real como um campo de testes crítico para o desenvolvimento de agentes práticos e fornece uma base para pesquisas em sistemas de IA com restrições temporais, destacando um caminho para agentes capacitados para atuação em tempo real.

English

Agents in the real world must make not only logical but also timely judgments. This requires continuous awareness of the dynamic environment: hazards emerge, opportunities arise, and other agents act, while the agent's reasoning is still unfolding. Despite advances in language model reasoning, existing approaches fail to account for this dynamic nature. We introduce real-time reasoning as a new problem formulation for agents in evolving environments and build Real-Time Reasoning Gym to demonstrate it. We study two paradigms for deploying language models in agents: (1) reactive agents, which employ language models with bounded reasoning computation for rapid responses, and (2) planning agents, which allow extended reasoning computation for complex problems. Our experiments show that even state-of-the-art models struggle with making logical and timely judgments in either paradigm. To address this limitation, we propose AgileThinker, which simultaneously engages both reasoning paradigms. AgileThinker consistently outperforms agents engaging only one reasoning paradigm as the task difficulty and time pressure rise, effectively balancing reasoning depth and response latency. Our work establishes real-time reasoning as a critical testbed for developing practical agents and provides a foundation for research in temporally constrained AI systems, highlighting a path toward real-time capable agents.