Boucler la boucle : Représentation universelle de dépôts avec l'encodeur RPG

papers.abstract

Les agents de dépôt actuels rencontrent un déficit de raisonnement dû à des représentations fragmentées, car les méthodes existantes reposent sur une documentation API isolée ou des graphes de dépendances manquant de profondeur sémantique. Nous considérons la compréhension et la génération de dépôts comme des processus inverses au sein d'un cycle unifié : la génération développe l'intention en implémentation, tandis que la compréhension comprime l'implémentation en intention. Pour résoudre ce problème, nous proposons RPG-Encoder, un cadre qui généralise le Graphe de Planification de Dépôt (RPG) d'un plan génératif statique en une représentation unifiée et haute fidélité. RPG-Encoder referme la boucle de raisonnement via trois mécanismes : (1) Encoder le code brut dans le RPG qui combine des caractéristiques sémantiques abstraites avec les dépendances du code ; (2) Faire évoluer la topologie de manière incrémentale pour découpler les coûts de maintenance de l'échelle du dépôt, réduisant la surcharge de 95,7 % ; et (3) Fonctionner comme une interface unifiée pour une navigation sensible à la structure. Lors des évaluations, RPG-Encoder établit l'état de l'art en compréhension de dépôts sur SWE-bench Verified avec 93,7 % Acc@5 et dépasse la meilleure base de référence de plus de 10 % sur SWE-bench Live Lite. Ces résultats soulignent notre précision de localisation fine supérieure dans des bases de code complexes. De plus, il atteint 98,5 % de couverture de reconstruction sur RepoCraft, confirmant la capacité haute fidélité du RPG à refléter la base de code originale et refermant la boucle entre l'intention et l'implémentation.

English

Current repository agents encounter a reasoning disconnect due to fragmented representations, as existing methods rely on isolated API documentation or dependency graphs that lack semantic depth. We consider repository comprehension and generation to be inverse processes within a unified cycle: generation expands intent into implementation, while comprehension compresses implementation back into intent. To address this, we propose RPG-Encoder, a framework that generalizes the Repository Planning Graph (RPG) from a static generative blueprint into a unified, high-fidelity representation. RPG-Encoder closes the reasoning loop through three mechanisms: (1) Encoding raw code into the RPG that combines lifted semantic features with code dependencies; (2) Evolving the topology incrementally to decouple maintenance costs from repository scale, reducing overhead by 95.7%; and (3) Operating as a unified interface for structure-aware navigation. In evaluations, RPG-Encoder establishes state-of-the-art repository understanding on SWE-bench Verified with 93.7% Acc@5 and exceeds the best baseline by over 10% on SWE-bench Live Lite. These results highlight our superior fine-grained localization accuracy in complex codebases. Furthermore, it achieves 98.5% reconstruction coverage on RepoCraft, confirming RPG's high-fidelity capacity to mirror the original codebase and closing the loop between intent and implementation.

Boucler la boucle : Représentation universelle de dépôts avec l'encodeur RPG

Closing the Loop: Universal Repository Representation with RPG-Encoder

papers.abstract

Support