Rompiendo el Gráfico Estático: Travesía Consciente del Contexto para una Generación Aumentada por Recuperación Robusta
Breaking the Static Graph: Context-Aware Traversal for Robust Retrieval-Augmented Generation
February 2, 2026
Autores: Kwun Hang Lau, Fangyuan Zhang, Boyu Ruan, Yingli Zhou, Qintian Guo, Ruiyuan Zhang, Xiaofang Zhou
cs.AI
Resumen
Los recientes avances en Generación Aumentada por Recuperación (RAG) han evolucionado desde la simple similitud vectorial hacia enfoques conscientes de la estructura, como HippoRAG, que aprovechan los Grafos de Conocimiento (KG) y el PageRank Personalizado (PPR) para capturar dependencias de múltiples saltos. Sin embargo, estos métodos adolecen de una "Falacia del Grafo Estático": dependen de probabilidades de transición fijas determinadas durante la indexación. Esta rigidez ignora la naturaleza dependiente de la consulta de la relevancia de las aristas, causando una deriva semántica donde los paseos aleatorios se desvían hacia nodos "concentradores" de alto grado antes de alcanzar la evidencia crítica aguas abajo. En consecuencia, los modelos a menudo logran un alto recuerdo parcial pero fallan en recuperar la cadena de evidencia completa requerida para consultas de múltiples saltos. Para abordarlo, proponemos CatRAG (Context-Aware Traversal for robust RAG), un marco que se basa en la arquitectura HippoRAG 2 y transforma el KG estático en una estructura de navegación adaptable a la consulta. Introducimos un marco multifacético para dirigir el paseo aleatorio: (1) Anclaje Simbólico, que inyecta restricciones débiles de entidades para regularizar el paseo aleatorio; (2) Ponderación Dinámica de Aristas Consciente de la Consulta, que modula dinámicamente la estructura del grafo, podando caminos irrelevantes mientras amplifica aquellos alineados con la intención de la consulta; y (3) Mejora de Ponderación de Pasajes de Hechos Clave, un sesgo de bajo costo que ancla estructuralmente el paseo aleatorio a evidencia probable. Los experimentos en cuatro benchmarks de múltiples saltos demuestran que CatRAG supera consistentemente a los baselines del estado del arte. Nuestro análisis revela que, si bien las métricas estándar de Recuerdo muestran ganancias modestas, CatRAG logra mejoras sustanciales en la integridad del razonamiento, es decir, la capacidad de recuperar la ruta de evidencia completa sin lagunas. Estos resultados muestran que nuestro enfoque cierra efectivamente la brecha entre recuperar contexto parcial y permitir un razonamiento completamente fundamentado. Los recursos están disponibles en https://github.com/kwunhang/CatRAG.
English
Recent advances in Retrieval-Augmented Generation (RAG) have shifted from simple vector similarity to structure-aware approaches like HippoRAG, which leverage Knowledge Graphs (KGs) and Personalized PageRank (PPR) to capture multi-hop dependencies. However, these methods suffer from a "Static Graph Fallacy": they rely on fixed transition probabilities determined during indexing. This rigidity ignores the query-dependent nature of edge relevance, causing semantic drift where random walks are diverted into high-degree "hub" nodes before reaching critical downstream evidence. Consequently, models often achieve high partial recall but fail to retrieve the complete evidence chain required for multi-hop queries. To address this, we propose CatRAG, Context-Aware Traversal for robust RAG, a framework that builds on the HippoRAG 2 architecture and transforms the static KG into a query-adaptive navigation structure. We introduce a multi-faceted framework to steer the random walk: (1) Symbolic Anchoring, which injects weak entity constraints to regularize the random walk; (2) Query-Aware Dynamic Edge Weighting, which dynamically modulates graph structure, to prune irrelevant paths while amplifying those aligned with the query's intent; and (3) Key-Fact Passage Weight Enhancement, a cost-efficient bias that structurally anchors the random walk to likely evidence. Experiments across four multi-hop benchmarks demonstrate that CatRAG consistently outperforms state of the art baselines. Our analysis reveals that while standard Recall metrics show modest gains, CatRAG achieves substantial improvements in reasoning completeness, the capacity to recover the entire evidence path without gaps. These results reveal that our approach effectively bridges the gap between retrieving partial context and enabling fully grounded reasoning. Resources are available at https://github.com/kwunhang/CatRAG.