ChatPaper.aiChatPaper

ReCode: Vereinheitlichung von Plan und Aktion für universelle Granularitätssteuerung

ReCode: Unify Plan and Action for Universal Granularity Control

October 27, 2025
papers.authors: Zhaoyang Yu, Jiayi Zhang, Huixue Su, Yufan Zhao, Yifan Wu, Mingyi Deng, Jinyu Xiang, Yizhang Lin, Lingxiao Tang, Yingchao Li, Yuyu Luo, Bang Liu, Chenglin Wu
cs.AI

papers.abstract

Echtweltaufgaben erfordern Entscheidungen auf unterschiedlichen Detaillierungsebenen, und Menschen sind darin besonders gut, indem sie auf eine einheitliche kognitive Repräsentation zurückgreifen, in der Planung grundsätzlich als eine hochrangige Form von Handeln verstanden wird. Jedoch fehlt es aktuellen, auf großen Sprachmodellen (LLM) basierenden Agenten an dieser entscheidenden Fähigkeit, fließend über verschiedene Entscheidungsgranularitäten hinweg zu operieren. Diese Einschränkung rührt von bestehenden Paradigmen her, die eine strikte Trennung zwischen hochrangiger Planung und niederrangigem Handeln erzwingen, was die dynamische Anpassungsfähigkeit beeinträchtigt und die Generalisierung limitiert. Wir schlagen ReCode (Rekursive Code-Generierung) vor, ein neuartiges Paradigma, das diese Limitation adressiert, indem es Planung und Handlung innerhalb einer einzigen Code-Repräsentation vereint. In dieser Repräsentation behandelt ReCode hochrangige Pläne als abstrakte Platzhalterfunktionen, die der Agent dann rekursiv in feiner granulierte Unterfunktionen zerlegt, bis er primitive Aktionen erreicht. Dieser rekursive Ansatz löst die starre Grenze zwischen Plan und Aktion auf und ermöglicht es dem Agenten, seine Entscheidungsgranularität dynamisch zu steuern. Darüber hinaus erzeugt die rekursive Struktur inhärent umfangreiche, multi-granulare Trainingsdaten, die es Modellen ermöglichen, hierarchische Entscheidungsprozesse zu erlernen. Umfangreiche Experimente zeigen, dass ReCode fortschrittliche Vergleichsbaselines in der Inferenzleistung signifikant übertrifft und eine außergewöhnliche Dateneffizienz im Training demonstriert. Dies validiert unsere zentrale Erkenntnis, dass die Vereinheitlichung von Planung und Handlung durch rekursive Code-Generierung ein leistungsstarker und effektiver Ansatz zur Erreichung universeller Granularitätskontrolle ist. Der Code ist verfügbar unter https://github.com/FoundationAgents/ReCode.
English
Real-world tasks require decisions at varying granularities, and humans excel at this by leveraging a unified cognitive representation where planning is fundamentally understood as a high-level form of action. However, current Large Language Model (LLM)-based agents lack this crucial capability to operate fluidly across decision granularities. This limitation stems from existing paradigms that enforce a rigid separation between high-level planning and low-level action, which impairs dynamic adaptability and limits generalization. We propose ReCode (Recursive Code Generation), a novel paradigm that addresses this limitation by unifying planning and action within a single code representation. In this representation, ReCode treats high-level plans as abstract placeholder functions, which the agent then recursively decomposes into finer-grained sub-functions until reaching primitive actions. This recursive approach dissolves the rigid boundary between plan and action, enabling the agent to dynamically control its decision granularity. Furthermore, the recursive structure inherently generates rich, multi-granularity training data, enabling models to learn hierarchical decision-making processes. Extensive experiments show ReCode significantly surpasses advanced baselines in inference performance and demonstrates exceptional data efficiency in training, validating our core insight that unifying planning and action through recursive code generation is a powerful and effective approach to achieving universal granularity control. The code is available at https://github.com/FoundationAgents/ReCode.
PDF1211December 31, 2025