Durchbrechen statischer Graphen: Kontextbewusstes Durchlaufen für robuste abrufverstärkte Generierung
Breaking the Static Graph: Context-Aware Traversal for Robust Retrieval-Augmented Generation
February 2, 2026
papers.authors: Kwun Hang Lau, Fangyuan Zhang, Boyu Ruan, Yingli Zhou, Qintian Guo, Ruiyuan Zhang, Xiaofang Zhou
cs.AI
papers.abstract
Jüngste Fortschritte beim Retrieval-Augmented Generation (RAG) haben sich von einfacher Vektorähnlichkeit hin zu strukturorientierten Ansätzen wie HippoRAG verlagert, die Wissensgraphen (KGs) und Personalized PageRank (PPR) nutzen, um mehrstufige Abhängigkeiten zu erfassen. Diese Methoden leiden jedoch unter einem "Static Graph Fallacy"-Problem: Sie stützen sich auf feste Übergangswahrscheinlichkeiten, die während der Indizierung bestimmt werden. Diese Starrheit ignoriert die abfrageabhängige Natur der Kantenrelevanz, was zu semantischer Drift führt, bei der Random Walks in hochgradige "Hub"-Knoten abgelenkt werden, bevor sie kritische nachgelagerte Evidenz erreichen. Infolgedessen erzielen Modelle oft eine hohe partielle Recall-Rate, scheitern aber daran, die für mehrstufige Abfragen erforderliche vollständige Evidenzkette abzurufen. Um dies zu beheben, schlagen wir CatRAG (Context-Aware Traversal for robust RAG) vor, ein Framework, das auf der HippoRAG-2-Architektur aufbaut und den statischen KG in eine abfrageadaptive Navigationsstruktur transformiert. Wir führen ein mehrstufiges Framework ein, um den Random Walk zu steuern: (1) Symbolic Anchoring, das schwache Entitätsbedingungen injiziert, um den Random Walk zu regularisieren; (2) Query-Aware Dynamic Edge Weighting, das die Graphstruktur dynamisch moduliert, um irrelevante Pfade zu beschneiden und gleichzeitig solche zu verstärken, die mit der Absicht der Abfrage übereinstimmen; und (3) Key-Fact Passage Weight Enhancement, eine kostengünstige Verzerrung, die den Random Walk strukturell an wahrscheinliche Evidenz verankert. Experimente über vier mehrstufige Benchmarks zeigen, dass CatRAG durchgängig state-of-the-art Baseline-Methoden übertrifft. Unsere Analyse zeigt, dass CatRAG zwar bei standardmäßigen Recall-Metriken nur moderate Verbesserungen erzielt, aber substantiale Fortschritte in der Schlussfolgerungsvollständigkeit erreicht – der Fähigkeit, den gesamten Evidenzpfad ohne Lücken wiederherzustellen. Diese Ergebnisse zeigen, dass unser Ansatz die Lücke zwischen dem Abruf von Teilkontext und vollständig begründetem Reasoning effektiv schließt. Ressourcen sind verfügbar unter https://github.com/kwunhang/CatRAG.
English
Recent advances in Retrieval-Augmented Generation (RAG) have shifted from simple vector similarity to structure-aware approaches like HippoRAG, which leverage Knowledge Graphs (KGs) and Personalized PageRank (PPR) to capture multi-hop dependencies. However, these methods suffer from a "Static Graph Fallacy": they rely on fixed transition probabilities determined during indexing. This rigidity ignores the query-dependent nature of edge relevance, causing semantic drift where random walks are diverted into high-degree "hub" nodes before reaching critical downstream evidence. Consequently, models often achieve high partial recall but fail to retrieve the complete evidence chain required for multi-hop queries. To address this, we propose CatRAG, Context-Aware Traversal for robust RAG, a framework that builds on the HippoRAG 2 architecture and transforms the static KG into a query-adaptive navigation structure. We introduce a multi-faceted framework to steer the random walk: (1) Symbolic Anchoring, which injects weak entity constraints to regularize the random walk; (2) Query-Aware Dynamic Edge Weighting, which dynamically modulates graph structure, to prune irrelevant paths while amplifying those aligned with the query's intent; and (3) Key-Fact Passage Weight Enhancement, a cost-efficient bias that structurally anchors the random walk to likely evidence. Experiments across four multi-hop benchmarks demonstrate that CatRAG consistently outperforms state of the art baselines. Our analysis reveals that while standard Recall metrics show modest gains, CatRAG achieves substantial improvements in reasoning completeness, the capacity to recover the entire evidence path without gaps. These results reveal that our approach effectively bridges the gap between retrieving partial context and enabling fully grounded reasoning. Resources are available at https://github.com/kwunhang/CatRAG.