SweRank: コードランキングによるソフトウェア課題の特定
SweRank: Software Issue Localization with Code Ranking
May 7, 2025
著者: Revanth Gangi Reddy, Tarun Suresh, JaeHyeok Doo, Ye Liu, Xuan Phi Nguyen, Yingbo Zhou, Semih Yavuz, Caiming Xiong, Heng Ji, Shafiq Joty
cs.AI
要旨
ソフトウェア課題のローカライゼーションは、自然言語による課題説明(例:バグレポート、機能リクエスト)に関連する正確なコードの位置(ファイル、クラス、または関数)を特定するタスクであり、ソフトウェア開発において重要なものの、時間を要する側面です。最近のLLMベースのエージェント的アプローチは有望であるものの、複雑な多段階推論とクローズドソースのLLMへの依存により、大きな遅延とコストが発生しがちです。一方で、従来のコードランキングモデルは、通常クエリ対コードまたはコード対コードの検索に最適化されており、冗長で失敗を記述する性質を持つローカライゼーションクエリに対応するのが困難です。このギャップを埋めるため、我々はSweRankを紹介します。これは、ソフトウェア課題ローカライゼーションのための効率的で効果的な検索・再ランクフレームワークです。トレーニングを容易にするため、我々はSweLocを構築しました。これは、公開されているGitHubリポジトリからキュレートされた大規模なデータセットで、実際の課題説明とそれに対応するコード変更をペアにしています。SWE-Bench-LiteとLocBenchでの実験結果は、SweRankが最先端のパフォーマンスを達成し、従来のランキングモデルやClaude-3.5のようなクローズドソースのLLMを使用する高コストなエージェントベースのシステムを上回ることを示しています。さらに、我々はSweLocが既存の各種検索モデルや再ランクモデルを強化するための有用性を示し、このデータセットがコミュニティにとって貴重なリソースであることを確立しました。
English
Software issue localization, the task of identifying the precise code
locations (files, classes, or functions) relevant to a natural language issue
description (e.g., bug report, feature request), is a critical yet
time-consuming aspect of software development. While recent LLM-based agentic
approaches demonstrate promise, they often incur significant latency and cost
due to complex multi-step reasoning and relying on closed-source LLMs.
Alternatively, traditional code ranking models, typically optimized for
query-to-code or code-to-code retrieval, struggle with the verbose and
failure-descriptive nature of issue localization queries. To bridge this gap,
we introduce SweRank, an efficient and effective retrieve-and-rerank framework
for software issue localization. To facilitate training, we construct SweLoc, a
large-scale dataset curated from public GitHub repositories, featuring
real-world issue descriptions paired with corresponding code modifications.
Empirical results on SWE-Bench-Lite and LocBench show that SweRank achieves
state-of-the-art performance, outperforming both prior ranking models and
costly agent-based systems using closed-source LLMs like Claude-3.5. Further,
we demonstrate SweLoc's utility in enhancing various existing retriever and
reranker models for issue localization, establishing the dataset as a valuable
resource for the community.Summary
AI-Generated Summary