Den Kreislauf schließen: Universelle Repository-Repräsentation mit RPG-Encoder

papers.abstract

Aktuelle Repository-Agenten stoßen auf eine Denkdiskrepanz aufgrund fragmentierter Repräsentationen, da bestehende Methoden auf isolierten API-Dokumentationen oder Abhängigkeitsgraphen beruhen, denen semantische Tiefe fehlt. Wir betrachten Repository-Verständnis und -Generierung als inverse Prozesse innerhalb eines vereinheitlichten Zyklus: Generierung erweitert Absicht in Implementierung, während Verständnis Implementierung zurück in Absicht komprimiert. Um dies zu adressieren, schlagen wir RPG-Encoder vor, ein Framework, das den Repository-Planungsgraphen (RPG) von einer statischen generativen Blaupause in eine vereinheitlichte, hochpräzise Repräsentation verallgemeinert. RPG-Encoder schließt den Denkkreislauf durch drei Mechanismen: (1) Kodierung von Rohcode in den RPG, der angehobene semantische Merkmale mit Code-Abhängigkeiten kombiniert; (2) inkrementelle Evolution der Topologie, um Wartungskosten von der Repository-Größe zu entkoppeln, was den Overhead um 95,7 % reduziert; und (3) Betrieb als vereinheitlichte Schnittstelle für strukturbewusste Navigation. In Evaluierungen etabliert RPG-Encoder state-of-the-art Repository-Verständnis auf SWE-bench Verified mit 93,7 % Acc@5 und übertrifft die beste Baseline auf SWE-bench Live Lite um über 10 %. Diese Ergebnisse unterstreichen unsere überlegene feinkörnige Lokalisierungsgenauigkeit in komplexen Codebasen. Darüber hinaus erreicht es 98,5 % Rekonstruktionsabdeckung auf RepoCraft, was die hochpräzise Fähigkeit des RPG bestätigt, die ursprüngliche Codebasis abzubilden und den Kreislauf zwischen Absicht und Implementierung zu schließen.

English

Current repository agents encounter a reasoning disconnect due to fragmented representations, as existing methods rely on isolated API documentation or dependency graphs that lack semantic depth. We consider repository comprehension and generation to be inverse processes within a unified cycle: generation expands intent into implementation, while comprehension compresses implementation back into intent. To address this, we propose RPG-Encoder, a framework that generalizes the Repository Planning Graph (RPG) from a static generative blueprint into a unified, high-fidelity representation. RPG-Encoder closes the reasoning loop through three mechanisms: (1) Encoding raw code into the RPG that combines lifted semantic features with code dependencies; (2) Evolving the topology incrementally to decouple maintenance costs from repository scale, reducing overhead by 95.7%; and (3) Operating as a unified interface for structure-aware navigation. In evaluations, RPG-Encoder establishes state-of-the-art repository understanding on SWE-bench Verified with 93.7% Acc@5 and exceeds the best baseline by over 10% on SWE-bench Live Lite. These results highlight our superior fine-grained localization accuracy in complex codebases. Furthermore, it achieves 98.5% reconstruction coverage on RepoCraft, confirming RPG's high-fidelity capacity to mirror the original codebase and closing the loop between intent and implementation.

Den Kreislauf schließen: Universelle Repository-Repräsentation mit RPG-Encoder

Closing the Loop: Universal Repository Representation with RPG-Encoder

papers.abstract

Support