ChatPaper.aiChatPaper

Chiudere il Cerchio: Rappresentazione Universale dei Repository con RPG-Encoder

Closing the Loop: Universal Repository Representation with RPG-Encoder

February 2, 2026
Autori: Jane Luo, Chengyu Yin, Xin Zhang, Qingtao Li, Steven Liu, Yiming Huang, Jie Wu, Hao Liu, Yangyu Huang, Yu Kang, Fangkai Yang, Ying Xin, Scarlett Li
cs.AI

Abstract

Gli agenti di repository attuali incontrano una disconnessione nel ragionamento a causa di rappresentazioni frammentate, poiché i metodi esistenti si basano su documentazioni API isolate o grafi di dipendenze che mancano di profondità semantica. Consideriamo la comprensione e la generazione del repository come processi inversi all'interno di un ciclo unificato: la generazione espande l'intento in implementazione, mentre la comprensione comprime l'implementazione nuovamente in intento. Per affrontare questo problema, proponiamo RPG-Encoder, un framework che generalizza il Repository Planning Graph (RPG) da un progetto generativo statico a una rappresentazione unificata ad alta fedeltà. RPG-Encoder chiude il ciclo di ragionamento attraverso tre meccanismi: (1) Codifica del codice grezzo nell'RPG che combina caratteristiche semantiche estratte con le dipendenze del codice; (2) Evoluzione incrementale della topologia per disaccoppiare i costi di manutenzione dalla scala del repository, riducendo l'overhead del 95,7%; e (3) Funzionamento come interfaccia unificata per la navigazione consapevole della struttura. Nelle valutazioni, RPG-Encoder stabilisce lo stato dell'arte nella comprensione dei repository su SWE-bench Verified con 93,7% Acc@5 e supera la migliore baseline di oltre il 10% su SWE-bench Live Lite. Questi risultati evidenziano la nostra precisione superiore nella localizzazione granulare in codebase complessi. Inoltre, raggiunge una copertura della ricostruzione del 98,5% su RepoCraft, confermando l'elevata capacità fedele dell'RPG di rispecchiare il codebase originale e chiudendo il ciclo tra intento e implementazione.
English
Current repository agents encounter a reasoning disconnect due to fragmented representations, as existing methods rely on isolated API documentation or dependency graphs that lack semantic depth. We consider repository comprehension and generation to be inverse processes within a unified cycle: generation expands intent into implementation, while comprehension compresses implementation back into intent. To address this, we propose RPG-Encoder, a framework that generalizes the Repository Planning Graph (RPG) from a static generative blueprint into a unified, high-fidelity representation. RPG-Encoder closes the reasoning loop through three mechanisms: (1) Encoding raw code into the RPG that combines lifted semantic features with code dependencies; (2) Evolving the topology incrementally to decouple maintenance costs from repository scale, reducing overhead by 95.7%; and (3) Operating as a unified interface for structure-aware navigation. In evaluations, RPG-Encoder establishes state-of-the-art repository understanding on SWE-bench Verified with 93.7% Acc@5 and exceeds the best baseline by over 10% on SWE-bench Live Lite. These results highlight our superior fine-grained localization accuracy in complex codebases. Furthermore, it achieves 98.5% reconstruction coverage on RepoCraft, confirming RPG's high-fidelity capacity to mirror the original codebase and closing the loop between intent and implementation.
PDF832March 12, 2026