Het doorbreken van de statische grafiek: contextbewust doorlopen voor robuuste retrieval-augmented generation
Breaking the Static Graph: Context-Aware Traversal for Robust Retrieval-Augmented Generation
February 2, 2026
Auteurs: Kwun Hang Lau, Fangyuan Zhang, Boyu Ruan, Yingli Zhou, Qintian Guo, Ruiyuan Zhang, Xiaofang Zhou
cs.AI
Samenvatting
Recente vooruitgang in Retrieval-Augmented Generation (RAG) is verschoven van eenvoudige vectorvergelijkbaarheid naar structuurbewuste benaderingen zoals HippoRAG, die gebruikmaken van Knowledge Graphs (KGs) en Personalized PageRank (PPR) om multi-hop afhankelijkheden vast te leggen. Deze methoden lijden echter onder een "Static Graph Fallacy": ze vertrouwen op vaste overgangswaarschijnlijkheden die tijdens het indexeren worden bepaald. Deze rigiditeit negeert de query-afhankelijke aard van edge-relevantie, wat leidt tot semantische drift waarbij random walks worden afgeleid naar hoog-graad "hub"-nodes voordat ze kritisch downstream bewijs bereiken. Dientengevolge bereiken modellen vaak een hoge partiële recall, maar slagen ze er niet in de volledige bewijsketen die nodig is voor multi-hop queries op te halen. Om dit aan te pakken, stellen wij CatRAG voor, Context-Aware Traversal voor robuuste RAG, een raamwerk dat voortbouwt op de HippoRAG 2-architectuur en de statische KG transformeert naar een query-adaptieve navigatiestructuur. Wij introduceren een veelzijdig raamwerk om de random walk te sturen: (1) Symbolic Anchoring, dat zwakke entity constraints injecteert om de random walk te regulariseren; (2) Query-Aware Dynamic Edge Weighting, dat de grafiekstructuur dynamisch moduleert om irrelevante paden te snoeien en paden die zijn afgestemd op de intentie van de query te versterken; en (3) Key-Fact Passage Weight Enhancement, een kostenefficiënte bias die de random walk structureel verankert aan waarschijnlijk bewijs. Experimenten over vier multi-hop benchmarks tonen aan dat CatRAG consistent de state-of-the-art-baselines overtreft. Onze analyse toont aan dat, terwijl standaard Recall-metrieken bescheiden winst laten zien, CatRAG substantiële verbeteringen bereikt in redeneervolledigheid, het vermogen om het volledige bewijspad zonder hiaten te herstellen. Deze resultaten laten zien dat onze aanpak effectief de kloof overbrugt tussen het ophalen van partiële context en het mogelijk maken van volledig onderbouwde redenering. Middelen zijn beschikbaar op https://github.com/kwunhang/CatRAG.
English
Recent advances in Retrieval-Augmented Generation (RAG) have shifted from simple vector similarity to structure-aware approaches like HippoRAG, which leverage Knowledge Graphs (KGs) and Personalized PageRank (PPR) to capture multi-hop dependencies. However, these methods suffer from a "Static Graph Fallacy": they rely on fixed transition probabilities determined during indexing. This rigidity ignores the query-dependent nature of edge relevance, causing semantic drift where random walks are diverted into high-degree "hub" nodes before reaching critical downstream evidence. Consequently, models often achieve high partial recall but fail to retrieve the complete evidence chain required for multi-hop queries. To address this, we propose CatRAG, Context-Aware Traversal for robust RAG, a framework that builds on the HippoRAG 2 architecture and transforms the static KG into a query-adaptive navigation structure. We introduce a multi-faceted framework to steer the random walk: (1) Symbolic Anchoring, which injects weak entity constraints to regularize the random walk; (2) Query-Aware Dynamic Edge Weighting, which dynamically modulates graph structure, to prune irrelevant paths while amplifying those aligned with the query's intent; and (3) Key-Fact Passage Weight Enhancement, a cost-efficient bias that structurally anchors the random walk to likely evidence. Experiments across four multi-hop benchmarks demonstrate that CatRAG consistently outperforms state of the art baselines. Our analysis reveals that while standard Recall metrics show modest gains, CatRAG achieves substantial improvements in reasoning completeness, the capacity to recover the entire evidence path without gaps. These results reveal that our approach effectively bridges the gap between retrieving partial context and enabling fully grounded reasoning. Resources are available at https://github.com/kwunhang/CatRAG.