ChatPaper.aiChatPaper

ReCode:ユニバーサルな粒度制御のための計画とアクションの統合

ReCode: Unify Plan and Action for Universal Granularity Control

October 27, 2025
著者: Zhaoyang Yu, Jiayi Zhang, Huixue Su, Yufan Zhao, Yifan Wu, Mingyi Deng, Jinyu Xiang, Yizhang Lin, Lingxiao Tang, Yingchao Li, Yuyu Luo, Bang Liu, Chenglin Wu
cs.AI

要旨

現実世界のタスクでは様々な粒度での意思決定が要求され、人間は計画を高次元の行動として捉える統一的認知表現を活用することでこれに優れています。しかし、現在の大規模言語モデル(LLM)ベースのエージェントには、意思決定の粒度を柔軟に行き来するという重要な能力が欠けています。この制限は、高レベルの計画と低レベルの行動を厳密に分離する既存のパラダイムに起因し、動的適応性を損ない汎化能力を制限しています。 我々はこの問題を解決する新しいパラダイム「ReCode(Recursive Code Generation)」を提案します。このアプローチでは、計画と行動を単一のコード表現内に統合します。ReCodeは高レベルの計画を抽象的なプレースホルダ関数として扱い、エージェントがこれを原始的な行動に到達するまで再帰的に細粒度の副関数へ分解します。この再帰的アプローチにより、計画と行動の間の硬直した境界が溶解し、エージェントは意思決定の粒度を動的に制御できるようになります。 さらに、この再帰的構造は本質的に豊富な多粒度トレーニングデータを生成し、モデルが階層的な意思決定プロセスを学習することを可能にします。大規模な実験により、ReCodeが推論性能において高度なベースラインを大幅に上回り、トレーニングにおける卓越したデータ効率を示すことが実証されました。これは、再帰的コード生成による計画と行動の統合が、普遍的な粒度制御を実現する強力かつ効果的なアプローチであるという我々の核心的洞察を裏付けるものです。コードはhttps://github.com/FoundationAgents/ReCodeで公開されています。
English
Real-world tasks require decisions at varying granularities, and humans excel at this by leveraging a unified cognitive representation where planning is fundamentally understood as a high-level form of action. However, current Large Language Model (LLM)-based agents lack this crucial capability to operate fluidly across decision granularities. This limitation stems from existing paradigms that enforce a rigid separation between high-level planning and low-level action, which impairs dynamic adaptability and limits generalization. We propose ReCode (Recursive Code Generation), a novel paradigm that addresses this limitation by unifying planning and action within a single code representation. In this representation, ReCode treats high-level plans as abstract placeholder functions, which the agent then recursively decomposes into finer-grained sub-functions until reaching primitive actions. This recursive approach dissolves the rigid boundary between plan and action, enabling the agent to dynamically control its decision granularity. Furthermore, the recursive structure inherently generates rich, multi-granularity training data, enabling models to learn hierarchical decision-making processes. Extensive experiments show ReCode significantly surpasses advanced baselines in inference performance and demonstrates exceptional data efficiency in training, validating our core insight that unifying planning and action through recursive code generation is a powerful and effective approach to achieving universal granularity control. The code is available at https://github.com/FoundationAgents/ReCode.
PDF1211December 31, 2025