ChatPaper.aiChatPaper

루프 닫기: RPG-인코더를 활용한 범용 저장소 표현 (또는 보다 학술적인 문맥에 맞게) 루프 완결: RPG-인코더를 이용한 보편적 저장소 표현

Closing the Loop: Universal Repository Representation with RPG-Encoder

February 2, 2026
저자: Jane Luo, Chengyu Yin, Xin Zhang, Qingtao Li, Steven Liu, Yiming Huang, Jie Wu, Hao Liu, Yangyu Huang, Yu Kang, Fangkai Yang, Ying Xin, Scarlett Li
cs.AI

초록

현재의 리포지토리 에이전트는 의미론적 깊이가 부족한 분리된 API 문서나 의존성 그래프에 의존하는 기존 방법으로 인해 파편화된 표현으로 인해 추론 단절을 겪고 있습니다. 우리는 리포지토리 이해와 생성을 통합된 순환 과정 내의 역과정으로 간주합니다: 생성은 의도를 구현으로 확장하는 반면, 이해는 구현을 의도로 다시 압축합니다. 이를 해결하기 위해 우리는 정적인 생성 청사진인 Repository Planning Graph(RPG)를 통합된 고충실도 표현으로 일반화하는 RPG-Encoder 프레임워크를 제안합니다. RPG-Encoder는 세 가지 메커니즘을 통해 추론 순환을 닫습니다: (1) 코드 의존성과 추출된 의미론적 특징을 결합한 RPG로 원시 코드를 인코딩; (2) 토폴로지를 점진적으로 진화시켜 유지보수 비용을 리포지토리 규모에서 분리하여 오버헤드를 95.7% 감소; (3) 구조 인식 탐색을 위한 통합 인터페이스로 운영. 평가에서 RPG-Encoder는 SWE-bench Verified에서 93.7% Acc@5로 최첨단 리포지토리 이해 성능을 확립했으며, SWE-bench Live Lite에서는 최고 기준선을 10% 이상 초과했습니다. 이러한 결과는 복잡한 코드베이스에서 우리의 우수한 세분화된 위치 정확도를 강조합니다. 또한 RepoCraft에서 98.5%의 재구성 커버리지를 달성하여 RPG가 원본 코드베이스를 반영하는 높은 충실도 능력과 의도와 구현 간의 순환을 닫는 능력을 확인했습니다.
English
Current repository agents encounter a reasoning disconnect due to fragmented representations, as existing methods rely on isolated API documentation or dependency graphs that lack semantic depth. We consider repository comprehension and generation to be inverse processes within a unified cycle: generation expands intent into implementation, while comprehension compresses implementation back into intent. To address this, we propose RPG-Encoder, a framework that generalizes the Repository Planning Graph (RPG) from a static generative blueprint into a unified, high-fidelity representation. RPG-Encoder closes the reasoning loop through three mechanisms: (1) Encoding raw code into the RPG that combines lifted semantic features with code dependencies; (2) Evolving the topology incrementally to decouple maintenance costs from repository scale, reducing overhead by 95.7%; and (3) Operating as a unified interface for structure-aware navigation. In evaluations, RPG-Encoder establishes state-of-the-art repository understanding on SWE-bench Verified with 93.7% Acc@5 and exceeds the best baseline by over 10% on SWE-bench Live Lite. These results highlight our superior fine-grained localization accuracy in complex codebases. Furthermore, it achieves 98.5% reconstruction coverage on RepoCraft, confirming RPG's high-fidelity capacity to mirror the original codebase and closing the loop between intent and implementation.
PDF812February 7, 2026