ChatPaper.aiChatPaper

GraphLocator: Graphgesteuerte Kausalschlussfolgerung zur Fehlerlokalisierung

GraphLocator: Graph-guided Causal Reasoning for Issue Localization

December 27, 2025
papers.authors: Wei Liu, Chao Peng, Pengfei Gao, Aofan Liu, Wei Zhang, Haiyan Zhao, Zhi Jin
cs.AI

papers.abstract

Die Aufgabe der Issue-Lokalisierung zielt darauf ab, die Stellen in einem Software-Repository zu identifizieren, die bei einer gegebenen Problembeschreibung in natürlicher Sprache angepasst werden müssen. Diese Aufgabe ist grundlegend, aber dennoch herausfordernd in der automatisierten Softwareentwicklung, was auf die semantische Lücke zwischen Problembeschreibung und Quellcode-Implementierung zurückzuführen ist. Diese Lücke zeigt sich in zwei Arten von Diskrepanzen: (1) Symptom-Ursache-Diskrepanzen, bei denen Beschreibungen die zugrundeliegenden Ursachen nicht explizit offenlegen; (2) Eins-zu-viele-Diskrepanzen, bei denen ein einzelnes Problem mehreren voneinander abhängigen Code-Entitäten entspricht. Um diese beiden Diskrepanzen zu adressieren, schlagen wir GraphLocator vor, einen Ansatz, der Symptom-Ursache-Diskrepanzen durch die Entdeckung kausaler Strukturen mildert und Eins-zu-viele-Diskrepanzen durch dynamische Issue-Entflechtung löst. Das zentrale Artefakt ist der kausale Issue-Graph (CIG), in dem Knoten entdeckte Teilprobleme zusammen mit ihren zugehörigen Code-Entitäten repräsentieren und Kanten die kausalen Abhängigkeiten zwischen ihnen abbilden. Der Arbeitsablauf von GraphLocator besteht aus zwei Phasen: Lokalisierung von Symptomknoten und dynamische CIG-Entdeckung; zunächst identifiziert er Symptompositionen im Repository-Graphen und erweitert dann dynamisch den CIG durch iteratives Schließen auf benachbarte Knoten. Experimente mit drei realen Datensätzen demonstrieren die Wirksamkeit von GraphLocator: (1) Im Vergleich zu Baseline-Verfahren erzielt GraphLocator eine genauere Lokalisierung mit durchschnittlichen Verbesserungen von +19,49 % beim Recall auf Funktionsebene und +11,89 % bei der Präzision. (2) GraphLocator übertrifft die Baseline-Verfahren sowohl bei Symptom-Ursache- als auch bei Eins-zu-viele-Diskrepanzen und erreicht Recall-Verbesserungen von +16,44 % bzw. +19,18 % sowie Präzisionsverbesserungen von +7,78 % bzw. +13,23 %. (3) Der von GraphLocator generierte CIG erzielt die höchste relative Verbesserung, was zu einer Steigerung von 28,74 % der Leistung bei nachgelagerten Lösungsaufgaben führt.
English
The issue localization task aims to identify the locations in a software repository that requires modification given a natural language issue description. This task is fundamental yet challenging in automated software engineering due to the semantic gap between issue description and source code implementation. This gap manifests as two mismatches:(1) symptom-to-cause mismatches, where descriptions do not explicitly reveal underlying root causes; (2) one-to-many mismatches, where a single issue corresponds to multiple interdependent code entities. To address these two mismatches, we propose GraphLocator, an approach that mitigates symptom-to-cause mismatches through causal structure discovering and resolves one-to-many mismatches via dynamic issue disentangling. The key artifact is the causal issue graph (CIG), in which vertices represent discovered sub-issues along with their associated code entities, and edges encode the causal dependencies between them. The workflow of GraphLocator consists of two phases: symptom vertices locating and dynamic CIG discovering; it first identifies symptom locations on the repository graph, then dynamically expands the CIG by iteratively reasoning over neighboring vertices. Experiments on three real-world datasets demonstrates the effectiveness of GraphLocator: (1) Compared with baselines, GraphLocator achieves more accurate localization with average improvements of +19.49% in function-level recall and +11.89% in precision. (2) GraphLocator outperforms baselines on both symptom-to-cause and one-to-many mismatch scenarios, achieving recall improvement of +16.44% and +19.18%, precision improvement of +7.78% and +13.23%, respectively. (3) The CIG generated by GraphLocator yields the highest relative improvement, resulting in a 28.74% increase in performance on downstream resolving task.
PDF21January 1, 2026