RPG: Un Grafo de Planificación de Repositorios para la Generación Unificada y Escalable de Bases de Código
RPG: A Repository Planning Graph for Unified and Scalable Codebase Generation
September 19, 2025
Autores: Jane Luo, Xin Zhang, Steven Liu, Jie Wu, Yiming Huang, Yangyu Huang, Chengyu Yin, Ying Xin, Jianfeng Liu, Yuefeng Zhan, Hao Sun, Qi Chen, Scarlett Li, Mao Yang
cs.AI
Resumen
Los modelos de lenguaje de gran escala destacan en la generación de código a nivel de funciones y archivos, pero la generación de repositorios completos desde cero sigue siendo un desafío fundamental. Este proceso requiere una planificación coherente y confiable en las etapas de propuesta e implementación, mientras que el lenguaje natural, debido a su ambigüedad y verbosidad, no es adecuado para representar fielmente estructuras de software complejas. Para abordar esto, presentamos el Grafo de Planificación de Repositorios (RPG, por sus siglas en inglés), una representación persistente que unifica la planificación a nivel de propuesta e implementación al codificar capacidades, estructuras de archivos, flujos de datos y funciones en un solo grafo. RPG reemplaza el lenguaje natural ambiguo con un plano explícito, permitiendo una planificación a largo plazo y la generación escalable de repositorios. Basándonos en RPG, desarrollamos ZeroRepo, un marco impulsado por grafos para la generación de repositorios desde cero. Opera en tres etapas: planificación a nivel de propuesta y refinamiento a nivel de implementación para construir el grafo, seguido de la generación de código guiada por el grafo con validación de pruebas. Para evaluar este enfoque, construimos RepoCraft, un punto de referencia con seis proyectos del mundo real que incluyen 1,052 tareas. En RepoCraft, ZeroRepo produce repositorios con un promedio de casi 36K líneas de código (LOC), aproximadamente 3.9 veces más que el mejor modelo base (Claude Code) y alrededor de 64 veces más que otros modelos base. Alcanza un 81.5% de cobertura funcional y una tasa de aprobación del 69.7%, superando a Claude Code en 27.3 y 35.8 puntos porcentuales, respectivamente. Un análisis adicional muestra que RPG modela dependencias complejas, permite una planificación progresivamente más sofisticada mediante un escalado casi lineal y mejora la comprensión de los repositorios por parte de los modelos de lenguaje, acelerando así la localización de agentes.
English
Large language models excel at function- and file-level code generation, yet
generating complete repositories from scratch remains a fundamental challenge.
This process demands coherent and reliable planning across proposal- and
implementation-level stages, while natural language, due to its ambiguity and
verbosity, is ill-suited for faithfully representing complex software
structures. To address this, we introduce the Repository Planning Graph (RPG),
a persistent representation that unifies proposal- and implementation-level
planning by encoding capabilities, file structures, data flows, and functions
in one graph. RPG replaces ambiguous natural language with an explicit
blueprint, enabling long-horizon planning and scalable repository generation.
Building on RPG, we develop ZeroRepo, a graph-driven framework for repository
generation from scratch. It operates in three stages: proposal-level planning
and implementation-level refinement to construct the graph, followed by
graph-guided code generation with test validation. To evaluate this setting, we
construct RepoCraft, a benchmark of six real-world projects with 1,052 tasks.
On RepoCraft, ZeroRepo produces repositories averaging nearly 36K LOC, roughly
3.9times the strongest baseline (Claude Code) and about 64times other
baselines. It attains 81.5% functional coverage and a 69.7% pass rate,
exceeding Claude Code by 27.3 and 35.8 percentage points, respectively. Further
analysis shows that RPG models complex dependencies, enables progressively more
sophisticated planning through near-linear scaling, and enhances LLM
understanding of repositories, thereby accelerating agent localization.