Quebrando o Grafo Estático: Travessia Sensível ao Contexto para Geração Aumentada por Recuperação Robusta
Breaking the Static Graph: Context-Aware Traversal for Robust Retrieval-Augmented Generation
February 2, 2026
Autores: Kwun Hang Lau, Fangyuan Zhang, Boyu Ruan, Yingli Zhou, Qintian Guo, Ruiyuan Zhang, Xiaofang Zhou
cs.AI
Resumo
Os recentes avanços na Geração Aumentada por Recuperação (RAG) evoluíram da simples similaridade vetorial para abordagens conscientes da estrutura, como o HippoRAG, que utilizam Grafos de Conhecimento (KGs) e PageRank Personalizado (PPR) para capturar dependências de múltiplos saltos. No entanto, estes métodos padecem de uma "Falácia do Grafo Estático": baseiam-se em probabilidades de transição fixas determinadas durante a indexação. Esta rigidez ignora a natureza dependente da consulta da relevância das arestas, causando um desvio semântico onde os passeios aleatórios são desviados para nós "hub" de alto grau antes de alcançarem evidências críticas a jusante. Consequentemente, os modelos frequentemente alcançam alta recuperação parcial, mas falham em recuperar a cadeia de evidências completa necessária para consultas de múltiplos saltos. Para resolver isto, propomos o CatRAG, Travessia Consciente do Contexto para RAG robusto, uma estrutura que se baseia na arquitetura HippoRAG 2 e transforma o KG estático numa estrutura de navegação adaptativa à consulta. Introduzimos uma estrutura multifacetada para orientar o passeio aleatório: (1) Ancoragem Simbólica, que injeta restrições fracas de entidades para regularizar o passeio aleatório; (2) Ponderação Dinâmica de Arestas Consciente da Consulta, que modula dinamicamente a estrutura do grafo, para podar caminhos irrelevantes enquanto amplifica os alinhados com a intenção da consulta; e (3) Reforço de Peso de Passagem com Factos-Chave, um enviesamento de baixo custo que ancora estruturalmente o passeio aleatório a evidências prováveis. Experiências em quatro benchmarks de múltiplos saltos demonstram que o CatRAG supera consistentemente as linhas de base do estado da arte. A nossa análise revela que, embora as métricas padrão de Recuperação mostrem ganhos modestos, o CatRAG alcança melhorias substanciais na completude do raciocínio, a capacidade de recuperar todo o percurso de evidências sem lacunas. Estes resultados revelam que a nossa abordagem preenche eficazmente a lacuna entre a recuperação de contexto parcial e a possibilidade de um raciocínio totalmente fundamentado. Os recursos estão disponíveis em https://github.com/kwunhang/CatRAG.
English
Recent advances in Retrieval-Augmented Generation (RAG) have shifted from simple vector similarity to structure-aware approaches like HippoRAG, which leverage Knowledge Graphs (KGs) and Personalized PageRank (PPR) to capture multi-hop dependencies. However, these methods suffer from a "Static Graph Fallacy": they rely on fixed transition probabilities determined during indexing. This rigidity ignores the query-dependent nature of edge relevance, causing semantic drift where random walks are diverted into high-degree "hub" nodes before reaching critical downstream evidence. Consequently, models often achieve high partial recall but fail to retrieve the complete evidence chain required for multi-hop queries. To address this, we propose CatRAG, Context-Aware Traversal for robust RAG, a framework that builds on the HippoRAG 2 architecture and transforms the static KG into a query-adaptive navigation structure. We introduce a multi-faceted framework to steer the random walk: (1) Symbolic Anchoring, which injects weak entity constraints to regularize the random walk; (2) Query-Aware Dynamic Edge Weighting, which dynamically modulates graph structure, to prune irrelevant paths while amplifying those aligned with the query's intent; and (3) Key-Fact Passage Weight Enhancement, a cost-efficient bias that structurally anchors the random walk to likely evidence. Experiments across four multi-hop benchmarks demonstrate that CatRAG consistently outperforms state of the art baselines. Our analysis reveals that while standard Recall metrics show modest gains, CatRAG achieves substantial improvements in reasoning completeness, the capacity to recover the entire evidence path without gaps. These results reveal that our approach effectively bridges the gap between retrieving partial context and enabling fully grounded reasoning. Resources are available at https://github.com/kwunhang/CatRAG.