ChatPaper.aiChatPaper

進化する環境におけるリアルタイム推論エージェント

Real-Time Reasoning Agents in Evolving Environments

November 7, 2025
著者: Yule Wen, Yixin Ye, Yanzhe Zhang, Diyi Yang, Hao Zhu
cs.AI

要旨

現実世界におけるエージェントは、論理的であるだけでなく、適時性のある判断を下さなければなりません。これには、動的に変化する環境への持続的な認識が求められます。危険が発生し、機会が訪れ、他のエージェントが行動する中で、当該エージェントの推論はまだ進行中なのです。言語モデルの推論技術が進歩しているにもかかわらず、既存のアプローチはこの動的な性質を考慮できていません。本研究では、変化する環境におけるエージェントの新たな問題設定として「リアルタイム推論」を提唱し、これを実証するためのReal-Time Reasoning Gymを構築しました。我々は、エージェントへの言語モデル導入における二つのパラダイムを検討します。(1) 反応型エージェント:迅速な応答のために計算量が限定された言語モデルを用いるもの、(2) 計画型エージェント:複雑な問題に対して計算量を多く割いた推論を許容するもの。実験の結果、最先端のモデルであっても、いずれのパラダイムにおいても論理的かつ適時性のある判断を下すことに苦戦することが明らかになりました。この課題を解決するため、我々は両方の推論パラダイムを同時に駆動するAgileThinkerを提案します。AgileThinkerは、課題の難易度と時間的制約が高まるにつれて、単一の推論パラダイムのみを用いるエージェントを一貫して上回り、推論の深さと応答遅延のバランスを効果的に取ります。本研究は、実用的なエージェント開発における重要なテストベッドとしてリアルタイム推論を確立し、時間制約のあるAIシステムの研究基盤を提供することで、リアルタイム対応エージェントへの道筋を示すものです。
English
Agents in the real world must make not only logical but also timely judgments. This requires continuous awareness of the dynamic environment: hazards emerge, opportunities arise, and other agents act, while the agent's reasoning is still unfolding. Despite advances in language model reasoning, existing approaches fail to account for this dynamic nature. We introduce real-time reasoning as a new problem formulation for agents in evolving environments and build Real-Time Reasoning Gym to demonstrate it. We study two paradigms for deploying language models in agents: (1) reactive agents, which employ language models with bounded reasoning computation for rapid responses, and (2) planning agents, which allow extended reasoning computation for complex problems. Our experiments show that even state-of-the-art models struggle with making logical and timely judgments in either paradigm. To address this limitation, we propose AgileThinker, which simultaneously engages both reasoning paradigms. AgileThinker consistently outperforms agents engaging only one reasoning paradigm as the task difficulty and time pressure rise, effectively balancing reasoning depth and response latency. Our work establishes real-time reasoning as a critical testbed for developing practical agents and provides a foundation for research in temporally constrained AI systems, highlighting a path toward real-time capable agents.
PDF112December 2, 2025