ChatPaper.aiChatPaper

パイプラインを超えて:モデルネイティブなエージェンシックAIへのパラダイムシフトの調査

Beyond Pipelines: A Survey of the Paradigm Shift toward Model-Native Agentic AI

October 19, 2025
著者: Jitao Sang, Jinlin Xiao, Jiarun Han, Jilin Chen, Xiaoyi Chen, Shuyu Wei, Yongjie Sun, Yuhang Wang
cs.AI

要旨

エージェンシックAIの急速な進化は、人工知能の新たな段階を画するものであり、大規模言語モデル(LLMs)が単に応答するだけでなく、行動し、推論し、適応するようになったことを示している。本調査は、エージェンシックAIの構築におけるパラダイムシフトを追跡するものである。すなわち、計画、ツール使用、記憶が外部のロジックによって調整されるパイプライン型システムから、これらの能力がモデルのパラメータ内に内在化される新興のモデルネイティブパラダイムへの移行である。まず、このパラダイムシフトを可能にするアルゴリズムエンジンとして強化学習(RL)を位置づける。静的データの模倣から結果駆動型探索へと学習を再定義することで、RLは言語、視覚、身体化領域にわたるLLM + RL + タスクの統一されたソリューションを支える。これを基盤として、本調査は、各能力——計画、ツール使用、記憶——が外部スクリプト化されたモジュールからエンドツーエンドで学習された行動へとどのように進化してきたかを体系的にレビューする。さらに、このパラダイムシフトが主要なエージェントアプリケーション、特に長期的推論を重視するディープリサーチエージェントと身体化インタラクションを重視するGUIエージェントをどのように再形成したかを検証する。最後に、マルチエージェント協調やリフレクションといったエージェンシック能力の継続的な内在化、および将来のエージェンシックAIにおけるシステム層とモデル層の役割の進化について議論する。これらの発展は、統合された学習およびインタラクションフレームワークとしてのモデルネイティブエージェンシックAIへの一貫した軌跡を描き、知能を適用するシステムを構築することから、経験を通じて知能を成長させるモデルを開発することへの移行を示している。
English
The rapid evolution of agentic AI marks a new phase in artificial intelligence, where Large Language Models (LLMs) no longer merely respond but act, reason, and adapt. This survey traces the paradigm shift in building agentic AI: from Pipeline-based systems, where planning, tool use, and memory are orchestrated by external logic, to the emerging Model-native paradigm, where these capabilities are internalized within the model's parameters. We first position Reinforcement Learning (RL) as the algorithmic engine enabling this paradigm shift. By reframing learning from imitating static data to outcome-driven exploration, RL underpins a unified solution of LLM + RL + Task across language, vision and embodied domains. Building on this, the survey systematically reviews how each capability -- Planning, Tool use, and Memory -- has evolved from externally scripted modules to end-to-end learned behaviors. Furthermore, it examines how this paradigm shift has reshaped major agent applications, specifically the Deep Research agent emphasizing long-horizon reasoning and the GUI agent emphasizing embodied interaction. We conclude by discussing the continued internalization of agentic capabilities like Multi-agent collaboration and Reflection, alongside the evolving roles of the system and model layers in future agentic AI. Together, these developments outline a coherent trajectory toward model-native agentic AI as an integrated learning and interaction framework, marking the transition from constructing systems that apply intelligence to developing models that grow intelligence through experience.
PDF62October 21, 2025