Rompant avec le graphe statique : Parcours contextuel pour une génération augmentée par la recherche robuste
Breaking the Static Graph: Context-Aware Traversal for Robust Retrieval-Augmented Generation
February 2, 2026
papers.authors: Kwun Hang Lau, Fangyuan Zhang, Boyu Ruan, Yingli Zhou, Qintian Guo, Ruiyuan Zhang, Xiaofang Zhou
cs.AI
papers.abstract
Les avancées récentes en Génération Augmentée par Récupération (RAG) sont passées de la simple similarité vectorielle à des approches structurelles comme HippoRAG, qui exploitent les Graphes de Connaissances (KG) et le PageRank Personnalisé (PPR) pour capturer les dépendances multi-sauts. Cependant, ces méthodes souffrent d'un "Sophisme du Graphe Statique" : elles reposent sur des probabilités de transition fixes déterminées lors de l'indexation. Cette rigidité ignore la nature dépendante de la requête quant à la pertinence des arêtes, provoquant une dérive sémantique où les marches aléatoires sont détournées vers des nœuds "hubs" à haut degré avant d'atteindre les preuves en aval critiques. Par conséquent, les modèles obtiennent souvent un rappel partiel élevé mais échouent à récupérer la chaîne de preuves complète nécessaire pour les requêtes multi-sauts. Pour résoudre ce problème, nous proposons CatRAG (Context-Aware Traversal for robust RAG), un cadre qui s'appuie sur l'architecture HippoRAG 2 et transforme le KG statique en une structure de navigation adaptative à la requête. Nous introduisons un cadre multi-facettes pour guider la marche aléatoire : (1) l'Ancrage Symbolique, qui injecte des contraintes faibles sur les entités pour régulariser la marche aléatoire ; (2) la Pondération Dynamique des Arêtes Sensible à la Requête, qui module dynamiquement la structure du graphe pour élaguer les chemins non pertinents tout en amplifiant ceux alignés avec l'intention de la requête ; et (3) le Renforcement de Pondération des Passages de Faits Clés, un biais économique qui ancre structurellement la marche aléatoire vers les preuves probables. Les expériences sur quatre benchmarks multi-sauts démontrent que CatRAG surpasse constamment les lignes de base de l'état de l'art. Notre analyse révèle que si les métriques de rappel standard ne montrent que des gains modestes, CatRAG obtient des améliorations substantielles en complétude de raisonnement, c'est-à-dire la capacité à retrouver l'intégralité du chemin de preuve sans lacunes. Ces résultats montrent que notre approche comble efficacement l'écart entre la récupération d'un contexte partiel et la capacité à effectuer un raisonnement entièrement fondé. Les ressources sont disponibles à l'adresse https://github.com/kwunhang/CatRAG.
English
Recent advances in Retrieval-Augmented Generation (RAG) have shifted from simple vector similarity to structure-aware approaches like HippoRAG, which leverage Knowledge Graphs (KGs) and Personalized PageRank (PPR) to capture multi-hop dependencies. However, these methods suffer from a "Static Graph Fallacy": they rely on fixed transition probabilities determined during indexing. This rigidity ignores the query-dependent nature of edge relevance, causing semantic drift where random walks are diverted into high-degree "hub" nodes before reaching critical downstream evidence. Consequently, models often achieve high partial recall but fail to retrieve the complete evidence chain required for multi-hop queries. To address this, we propose CatRAG, Context-Aware Traversal for robust RAG, a framework that builds on the HippoRAG 2 architecture and transforms the static KG into a query-adaptive navigation structure. We introduce a multi-faceted framework to steer the random walk: (1) Symbolic Anchoring, which injects weak entity constraints to regularize the random walk; (2) Query-Aware Dynamic Edge Weighting, which dynamically modulates graph structure, to prune irrelevant paths while amplifying those aligned with the query's intent; and (3) Key-Fact Passage Weight Enhancement, a cost-efficient bias that structurally anchors the random walk to likely evidence. Experiments across four multi-hop benchmarks demonstrate that CatRAG consistently outperforms state of the art baselines. Our analysis reveals that while standard Recall metrics show modest gains, CatRAG achieves substantial improvements in reasoning completeness, the capacity to recover the entire evidence path without gaps. These results reveal that our approach effectively bridges the gap between retrieving partial context and enabling fully grounded reasoning. Resources are available at https://github.com/kwunhang/CatRAG.