RPG: Un Grafo de Planificación de Repositorios para la Generación Unificada y Escalable de Bases de Código

Resumen

Los modelos de lenguaje de gran escala destacan en la generación de código a nivel de funciones y archivos, pero la generación de repositorios completos desde cero sigue siendo un desafío fundamental. Este proceso requiere una planificación coherente y confiable en las etapas de propuesta e implementación, mientras que el lenguaje natural, debido a su ambigüedad y verbosidad, no es adecuado para representar fielmente estructuras de software complejas. Para abordar esto, presentamos el Grafo de Planificación de Repositorios (RPG, por sus siglas en inglés), una representación persistente que unifica la planificación a nivel de propuesta e implementación al codificar capacidades, estructuras de archivos, flujos de datos y funciones en un solo grafo. RPG reemplaza el lenguaje natural ambiguo con un plano explícito, permitiendo una planificación a largo plazo y la generación escalable de repositorios. Basándonos en RPG, desarrollamos ZeroRepo, un marco impulsado por grafos para la generación de repositorios desde cero. Opera en tres etapas: planificación a nivel de propuesta y refinamiento a nivel de implementación para construir el grafo, seguido de la generación de código guiada por el grafo con validación de pruebas. Para evaluar este enfoque, construimos RepoCraft, un punto de referencia con seis proyectos del mundo real que incluyen 1,052 tareas. En RepoCraft, ZeroRepo produce repositorios con un promedio de casi 36K líneas de código (LOC), aproximadamente 3.9 veces más que el mejor modelo base (Claude Code) y alrededor de 64 veces más que otros modelos base. Alcanza un 81.5% de cobertura funcional y una tasa de aprobación del 69.7%, superando a Claude Code en 27.3 y 35.8 puntos porcentuales, respectivamente. Un análisis adicional muestra que RPG modela dependencias complejas, permite una planificación progresivamente más sofisticada mediante un escalado casi lineal y mejora la comprensión de los repositorios por parte de los modelos de lenguaje, acelerando así la localización de agentes.

English

Large language models excel at function- and file-level code generation, yet generating complete repositories from scratch remains a fundamental challenge. This process demands coherent and reliable planning across proposal- and implementation-level stages, while natural language, due to its ambiguity and verbosity, is ill-suited for faithfully representing complex software structures. To address this, we introduce the Repository Planning Graph (RPG), a persistent representation that unifies proposal- and implementation-level planning by encoding capabilities, file structures, data flows, and functions in one graph. RPG replaces ambiguous natural language with an explicit blueprint, enabling long-horizon planning and scalable repository generation. Building on RPG, we develop ZeroRepo, a graph-driven framework for repository generation from scratch. It operates in three stages: proposal-level planning and implementation-level refinement to construct the graph, followed by graph-guided code generation with test validation. To evaluate this setting, we construct RepoCraft, a benchmark of six real-world projects with 1,052 tasks. On RepoCraft, ZeroRepo produces repositories averaging nearly 36K LOC, roughly 3.9times the strongest baseline (Claude Code) and about 64times other baselines. It attains 81.5% functional coverage and a 69.7% pass rate, exceeding Claude Code by 27.3 and 35.8 percentage points, respectively. Further analysis shows that RPG models complex dependencies, enables progressively more sophisticated planning through near-linear scaling, and enhances LLM understanding of repositories, thereby accelerating agent localization.

RPG: Un Grafo de Planificación de Repositorios para la Generación Unificada y Escalable de Bases de Código

RPG: A Repository Planning Graph for Unified and Scalable Codebase Generation

Resumen

Support