ChatPaper.aiChatPaper

De lus sluiten: universele repository-representatie met de RPG-Encoder

Closing the Loop: Universal Repository Representation with RPG-Encoder

February 2, 2026
Auteurs: Jane Luo, Chengyu Yin, Xin Zhang, Qingtao Li, Steven Liu, Yiming Huang, Jie Wu, Hao Liu, Yangyu Huang, Yu Kang, Fangkai Yang, Ying Xin, Scarlett Li
cs.AI

Samenvatting

Huidige repository-agents kampen met een redeneerkloof door gefragmenteerde representaties, aangezien bestaande methoden leunen op geïsoleerde API-documentatie of afhankelijkheidsgrafen die semantische diepte missen. Wij beschouwen repository-begrip en -generatie als inverse processen binnen een verenigde cyclus: generatie expandeert intentie naar implementatie, terwijl begrip implementatie comprimeert terug naar intentie. Om dit aan te pakken, stellen wij RPG-Encoder voor, een raamwerk dat de Repository Planning Graph (RPG) generaliseert van een statisch generatief blauwdruk naar een verenigde, hoogwaardige representatie. RPG-Encoder sluit de redeneerlus via drie mechanismen: (1) Encodering van ruwe code in de RPG, die opgeheven semantische kenmerken combineert met code-afhankelijkheden; (2) Incrementele evolutie van de topologie om onderhoudskosten te ontkoppelen van repositorieschaal, wat de overhead met 95,7% reduceert; en (3) Opereren als een verenigde interface voor structuurbewuste navigatie. In evaluaties vestigt RPG-Encoder state-of-the-art repository-begrip op SWE-bench Verified met 93,7% Acc@5 en overtreft de beste baseline met meer dan 10% op SWE-bench Live Lite. Deze resultaten benadrukken onze superieure fijnmazige localisatienauwkeurigheid in complexe codebasissen. Bovendien behaalt het 98,5% reconstructiedekking op RepoCraft, wat RPG's hoogwaardige capaciteit bevestigt om de originele codebase te weerspiegelen en de lus tussen intentie en implementatie sluit.
English
Current repository agents encounter a reasoning disconnect due to fragmented representations, as existing methods rely on isolated API documentation or dependency graphs that lack semantic depth. We consider repository comprehension and generation to be inverse processes within a unified cycle: generation expands intent into implementation, while comprehension compresses implementation back into intent. To address this, we propose RPG-Encoder, a framework that generalizes the Repository Planning Graph (RPG) from a static generative blueprint into a unified, high-fidelity representation. RPG-Encoder closes the reasoning loop through three mechanisms: (1) Encoding raw code into the RPG that combines lifted semantic features with code dependencies; (2) Evolving the topology incrementally to decouple maintenance costs from repository scale, reducing overhead by 95.7%; and (3) Operating as a unified interface for structure-aware navigation. In evaluations, RPG-Encoder establishes state-of-the-art repository understanding on SWE-bench Verified with 93.7% Acc@5 and exceeds the best baseline by over 10% on SWE-bench Live Lite. These results highlight our superior fine-grained localization accuracy in complex codebases. Furthermore, it achieves 98.5% reconstruction coverage on RepoCraft, confirming RPG's high-fidelity capacity to mirror the original codebase and closing the loop between intent and implementation.
PDF832March 12, 2026