ChatPaper.aiChatPaper

Agentes de Razonamiento en Tiempo Real en Entornos en Evolución

Real-Time Reasoning Agents in Evolving Environments

November 7, 2025
Autores: Yule Wen, Yixin Ye, Yanzhe Zhang, Diyi Yang, Hao Zhu
cs.AI

Resumen

Los agentes en el mundo real deben realizar juicios no solo lógicos, sino también oportunos. Esto requiere una conciencia continua del entorno dinámico: surgen peligros, aparecen oportunidades y otros agentes actúan, mientras que el razonamiento del agente aún se está desarrollando. A pesar de los avances en el razonamiento de modelos de lenguaje, los enfoques existentes no logran capturar esta naturaleza dinámica. Introducimos el razonamiento en tiempo real como una nueva formulación de problemas para agentes en entornos en evolución y construimos el Gimnasio de Razonamiento en Tiempo Real para demostrarlo. Estudiamos dos paradigmas para implementar modelos de lenguaje en agentes: (1) agentes reactivos, que emplean modelos de lenguaje con cómputo de razonamiento acotado para respuestas rápidas, y (2) agentes planificadores, que permiten un cómputo de razonamiento extendido para problemas complejos. Nuestros experimentos muestran que incluso los modelos más avanzados tienen dificultades para realizar juicios lógicos y oportunos en cualquiera de los paradigmas. Para abordar esta limitación, proponemos AgileThinker, que emplea simultáneamente ambos paradigmas de razonamiento. AgileThinker supera consistentemente a los agentes que utilizan solo un paradigma de razonamiento a medida que aumentan la dificultad de la tarea y la presión de tiempo, equilibrando efectivamente la profundidad del razonamiento y la latencia de respuesta. Nuestro trabajo establece el razonamiento en tiempo real como un banco de pruebas crítico para desarrollar agentes prácticos y proporciona una base para la investigación en sistemas de IA con restricciones temporales, destacando un camino hacia agentes capaces de operar en tiempo real.
English
Agents in the real world must make not only logical but also timely judgments. This requires continuous awareness of the dynamic environment: hazards emerge, opportunities arise, and other agents act, while the agent's reasoning is still unfolding. Despite advances in language model reasoning, existing approaches fail to account for this dynamic nature. We introduce real-time reasoning as a new problem formulation for agents in evolving environments and build Real-Time Reasoning Gym to demonstrate it. We study two paradigms for deploying language models in agents: (1) reactive agents, which employ language models with bounded reasoning computation for rapid responses, and (2) planning agents, which allow extended reasoning computation for complex problems. Our experiments show that even state-of-the-art models struggle with making logical and timely judgments in either paradigm. To address this limitation, we propose AgileThinker, which simultaneously engages both reasoning paradigms. AgileThinker consistently outperforms agents engaging only one reasoning paradigm as the task difficulty and time pressure rise, effectively balancing reasoning depth and response latency. Our work establishes real-time reasoning as a critical testbed for developing practical agents and provides a foundation for research in temporally constrained AI systems, highlighting a path toward real-time capable agents.
PDF112December 2, 2025