RPG: Граф планирования репозитория для универсальной и масштабируемой генерации кодовой базы

Аннотация

Крупные языковые модели демонстрируют выдающиеся результаты в генерации кода на уровне функций и файлов, однако создание полных репозиториев с нуля остается фундаментальной задачей. Этот процесс требует согласованного и надежного планирования на этапах предложения и реализации, в то время как естественный язык, из-за своей неоднозначности и многословности, плохо подходит для точного представления сложных программных структур. Для решения этой проблемы мы представляем Граф Планирования Репозитория (Repository Planning Graph, RPG) — устойчивое представление, которое объединяет планирование на уровне предложения и реализации, кодируя возможности, структуры файлов, потоки данных и функции в одном графе. RPG заменяет неоднозначный естественный язык явным планом, что позволяет осуществлять долгосрочное планирование и масштабируемую генерацию репозиториев. На основе RPG мы разработали ZeroRepo — граф-ориентированную структуру для генерации репозиториев с нуля. Она работает в три этапа: планирование на уровне предложения и уточнение на уровне реализации для построения графа, за которым следует генерация кода под управлением графа с проверкой тестов. Для оценки этого подхода мы создали RepoCraft — эталонный набор из шести реальных проектов с 1 052 задачами. На RepoCraft ZeroRepo создает репозитории, в среднем содержащие почти 36 тысяч строк кода, что примерно в 3,9 раза больше, чем у самого сильного базового метода (Claude Code), и примерно в 64 раза больше, чем у других базовых методов. Он достигает 81,5% функционального покрытия и 69,7% успешных тестов, превосходя Claude Code на 27,3 и 35,8 процентных пунктов соответственно. Дополнительный анализ показывает, что RPG моделирует сложные зависимости, позволяет постепенно усложнять планирование благодаря почти линейному масштабированию и улучшает понимание репозиториев языковыми моделями, тем самым ускоряя локализацию агентов.

English

Large language models excel at function- and file-level code generation, yet generating complete repositories from scratch remains a fundamental challenge. This process demands coherent and reliable planning across proposal- and implementation-level stages, while natural language, due to its ambiguity and verbosity, is ill-suited for faithfully representing complex software structures. To address this, we introduce the Repository Planning Graph (RPG), a persistent representation that unifies proposal- and implementation-level planning by encoding capabilities, file structures, data flows, and functions in one graph. RPG replaces ambiguous natural language with an explicit blueprint, enabling long-horizon planning and scalable repository generation. Building on RPG, we develop ZeroRepo, a graph-driven framework for repository generation from scratch. It operates in three stages: proposal-level planning and implementation-level refinement to construct the graph, followed by graph-guided code generation with test validation. To evaluate this setting, we construct RepoCraft, a benchmark of six real-world projects with 1,052 tasks. On RepoCraft, ZeroRepo produces repositories averaging nearly 36K LOC, roughly 3.9times the strongest baseline (Claude Code) and about 64times other baselines. It attains 81.5% functional coverage and a 69.7% pass rate, exceeding Claude Code by 27.3 and 35.8 percentage points, respectively. Further analysis shows that RPG models complex dependencies, enables progressively more sophisticated planning through near-linear scaling, and enhances LLM understanding of repositories, thereby accelerating agent localization.

RPG: Граф планирования репозитория для универсальной и масштабируемой генерации кодовой базы

RPG: A Repository Planning Graph for Unified and Scalable Codebase Generation

Аннотация

Support