Rompere il Grafo Statico: Attraversamento Contestuale per una Generazione Aumentata dal Recupero Robusta

Abstract

I recenti progressi nella Generazione Aumentata dal Recupero (RAG) si sono spostati dalla semplice similarità vettoriale ad approcci strutturalmente consapevoli come HippoRAG, che sfruttano Grafi della Conoscenza (KG) e il PageRank Personalizzato (PPR) per catturare dipendenze multi-hop. Tuttavia, questi metodi soffrono di una "Fallacia del Grafo Statico": si basano su probabilità di transizione fisse determinate durante l'indicizzazione. Questa rigidità ignora la natura dipendente dalla query della rilevanza degli archi, causando una deriva semantica in cui i random walk vengono deviati verso nodi "hub" ad alto grado prima di raggiungere le prove critiche a valle. Di conseguenza, i modelli spesso ottengono un alto richiamo parziale ma non riescono a recuperare la catena di prove completa richiesta per query multi-hop. Per affrontare questo problema, proponiamo CatRAG (Context-Aware Traversal for robust RAG), un framework che si basa sull'architettura HippoRAG 2 e trasforma il KG statico in una struttura di navigazione adattiva alla query. Introduciamo un framework multi-faccetta per guidare il random walk: (1) *Ancoraggio Simbolico*, che inietta vincoli deboli sulle entità per regolarizzare il random walk; (2) *Pesatura Dinamica degli Archi Consapevole della Query*, che modula dinamicamente la struttura del grafo, per potare i percorsi irrilevanti amplificando quelli allineati con l'intento della query; e (3) *Miglioramento del Peso dei Passaggi con Fatti Chiave*, un bias economicamente efficiente che ancora strutturalmente il random walk a prove probabili. Esperimenti su quattro benchmark multi-hop dimostrano che CatRAG supera costantemente le baseline state-of-the-art. La nostra analisi rivela che, sebbene le metriche standard di Richiamo mostrino guadagni modesti, CatRAG raggiunge miglioramenti sostanziali nella completezza del ragionamento, cioè la capacità di recuperare l'intero percorso probatorio senza lacune. Questi risultati rivelano che il nostro approccio colma efficacemente il divario tra il recupero di contesto parziale e l'abilitazione di un ragionamento completamente fondato. Le risorse sono disponibili su https://github.com/kwunhang/CatRAG.

English

Recent advances in Retrieval-Augmented Generation (RAG) have shifted from simple vector similarity to structure-aware approaches like HippoRAG, which leverage Knowledge Graphs (KGs) and Personalized PageRank (PPR) to capture multi-hop dependencies. However, these methods suffer from a "Static Graph Fallacy": they rely on fixed transition probabilities determined during indexing. This rigidity ignores the query-dependent nature of edge relevance, causing semantic drift where random walks are diverted into high-degree "hub" nodes before reaching critical downstream evidence. Consequently, models often achieve high partial recall but fail to retrieve the complete evidence chain required for multi-hop queries. To address this, we propose CatRAG, Context-Aware Traversal for robust RAG, a framework that builds on the HippoRAG 2 architecture and transforms the static KG into a query-adaptive navigation structure. We introduce a multi-faceted framework to steer the random walk: (1) Symbolic Anchoring, which injects weak entity constraints to regularize the random walk; (2) Query-Aware Dynamic Edge Weighting, which dynamically modulates graph structure, to prune irrelevant paths while amplifying those aligned with the query's intent; and (3) Key-Fact Passage Weight Enhancement, a cost-efficient bias that structurally anchors the random walk to likely evidence. Experiments across four multi-hop benchmarks demonstrate that CatRAG consistently outperforms state of the art baselines. Our analysis reveals that while standard Recall metrics show modest gains, CatRAG achieves substantial improvements in reasoning completeness, the capacity to recover the entire evidence path without gaps. These results reveal that our approach effectively bridges the gap between retrieving partial context and enabling fully grounded reasoning. Resources are available at https://github.com/kwunhang/CatRAG.

Rompere il Grafo Statico: Attraversamento Contestuale per una Generazione Aumentata dal Recupero Robusta

Breaking the Static Graph: Context-Aware Traversal for Robust Retrieval-Augmented Generation

Abstract

Support