SweRank: 코드 순위 기반 소프트웨어 이슈 지역화
SweRank: Software Issue Localization with Code Ranking
May 7, 2025
저자: Revanth Gangi Reddy, Tarun Suresh, JaeHyeok Doo, Ye Liu, Xuan Phi Nguyen, Yingbo Zhou, Semih Yavuz, Caiming Xiong, Heng Ji, Shafiq Joty
cs.AI
초록
소프트웨어 이슈 로컬라이제이션은 자연어로 작성된 이슈 설명(예: 버그 리포트, 기능 요청)과 관련된 정확한 코드 위치(파일, 클래스 또는 함수)를 식별하는 작업으로, 소프트웨어 개발에서 중요하지만 시간이 많이 소요되는 부분입니다. 최근 LLM 기반 에이전트 접근 방식이 유망한 결과를 보여주고 있지만, 복잡한 다단계 추론과 폐쇄형 LLM에 의존함으로써 상당한 지연 시간과 비용이 발생합니다. 반면, 전통적인 코드 랭킹 모델은 일반적으로 쿼리-투-코드 또는 코드-투-코드 검색에 최적화되어 있어, 이슈 로컬라이제이션 쿼리의 장황하고 실패를 설명하는 특성에 대처하기 어렵습니다. 이러한 격차를 해소하기 위해, 우리는 소프트웨어 이슈 로컬라이제이션을 위한 효율적이고 효과적인 검색 및 재랭킹 프레임워크인 SweRank을 소개합니다. 학습을 용이하게 하기 위해, 우리는 공개 GitHub 저장소에서 수집한 대규모 데이터셋인 SweLoc을 구축했습니다. 이 데이터셋은 실제 이슈 설명과 해당 코드 수정 사항을 짝지어 제공합니다. SWE-Bench-Lite와 LocBench에서의 실험 결과는 SweRank이 기존 랭킹 모델과 Claude-3.5와 같은 폐쇄형 LLM을 사용하는 비용이 많이 드는 에이전트 기반 시스템을 모두 능가하는 최첨단 성능을 달성함을 보여줍니다. 또한, 우리는 SweLoc이 다양한 기존 검색 및 재랭킹 모델의 이슈 로컬라이제이션 성능을 향상시키는 데 유용함을 입증하며, 이 데이터셋이 커뮤니티에 귀중한 자원임을 확인합니다.
English
Software issue localization, the task of identifying the precise code
locations (files, classes, or functions) relevant to a natural language issue
description (e.g., bug report, feature request), is a critical yet
time-consuming aspect of software development. While recent LLM-based agentic
approaches demonstrate promise, they often incur significant latency and cost
due to complex multi-step reasoning and relying on closed-source LLMs.
Alternatively, traditional code ranking models, typically optimized for
query-to-code or code-to-code retrieval, struggle with the verbose and
failure-descriptive nature of issue localization queries. To bridge this gap,
we introduce SweRank, an efficient and effective retrieve-and-rerank framework
for software issue localization. To facilitate training, we construct SweLoc, a
large-scale dataset curated from public GitHub repositories, featuring
real-world issue descriptions paired with corresponding code modifications.
Empirical results on SWE-Bench-Lite and LocBench show that SweRank achieves
state-of-the-art performance, outperforming both prior ranking models and
costly agent-based systems using closed-source LLMs like Claude-3.5. Further,
we demonstrate SweLoc's utility in enhancing various existing retriever and
reranker models for issue localization, establishing the dataset as a valuable
resource for the community.Summary
AI-Generated Summary