Преодоление ограничений статических графов: контекстно-зависимый обход для повышения надежности генерации с извлечением данных
Breaking the Static Graph: Context-Aware Traversal for Robust Retrieval-Augmented Generation
February 2, 2026
Авторы: Kwun Hang Lau, Fangyuan Zhang, Boyu Ruan, Yingli Zhou, Qintian Guo, Ruiyuan Zhang, Xiaofang Zhou
cs.AI
Аннотация
Последние достижения в области генерации с извлечением (RAG) сместились от простого векторного сходства к подходам, учитывающим структуру, таким как HippoRAG, которые используют графы знаний (KG) и персонализированный PageRank (PPR) для учета многошаговых зависимостей. Однако эти методы страдают от «заблуждения статического графа»: они опираются на фиксированные вероятности переходов, определенные на этапе индексирования. Эта жесткость игнорирует зависимую от запроса природу релевантности связей, вызывая семантический дрейф, когда случайные блуждания отклоняются в высокостепенные «хаб-узлы» до достижения критически важных нижестоящих свидетельств. Как следствие, модели часто достигают высокого частичного охвата, но не могут извлечь полную цепочку свидетельств, необходимую для многошаговых запросов. Чтобы решить эту проблему, мы предлагаем CatRAG (Context-Aware Traversal for robust RAG) — фреймворк, который строится на архитектуре HippoRAG 2 и преобразует статический KG в адаптивную к запросу навигационную структуру. Мы вводим многогранную систему для управления случайным блужданием: (1) Символьная привязка, которая вводит слабые ограничения на сущности для регуляризации случайного блуждания; (2) Динамическое взвешивание ребер с учетом запроса, которое динамически модулирует структуру графа, чтобы обрезать нерелевантные пути и усиливать те, что соответствуют интенции запроса; и (3) Усиление веса фрагментов с ключевыми фактами — экономичное смещение, которое структурно привязывает случайное блуждание к вероятным свидетельствам. Эксперименты на четырех наборах данных для многошаговых задач демонстрируют, что CatRAG стабильно превосходит современные базовые методы. Наш анализ показывает, что, хотя стандартные метрики охвата показывают скромный прирост, CatRAG достигает существенного улучшения в полноте рассуждений — способности восстановить всю цепочку свидетельств без пропусков. Эти результаты показывают, что наш подход эффективно устраняет разрыв между извлечением частичного контекста и возможностью полностью обоснованных рассуждений. Ресурсы доступны по адресу https://github.com/kwunhang/CatRAG.
English
Recent advances in Retrieval-Augmented Generation (RAG) have shifted from simple vector similarity to structure-aware approaches like HippoRAG, which leverage Knowledge Graphs (KGs) and Personalized PageRank (PPR) to capture multi-hop dependencies. However, these methods suffer from a "Static Graph Fallacy": they rely on fixed transition probabilities determined during indexing. This rigidity ignores the query-dependent nature of edge relevance, causing semantic drift where random walks are diverted into high-degree "hub" nodes before reaching critical downstream evidence. Consequently, models often achieve high partial recall but fail to retrieve the complete evidence chain required for multi-hop queries. To address this, we propose CatRAG, Context-Aware Traversal for robust RAG, a framework that builds on the HippoRAG 2 architecture and transforms the static KG into a query-adaptive navigation structure. We introduce a multi-faceted framework to steer the random walk: (1) Symbolic Anchoring, which injects weak entity constraints to regularize the random walk; (2) Query-Aware Dynamic Edge Weighting, which dynamically modulates graph structure, to prune irrelevant paths while amplifying those aligned with the query's intent; and (3) Key-Fact Passage Weight Enhancement, a cost-efficient bias that structurally anchors the random walk to likely evidence. Experiments across four multi-hop benchmarks demonstrate that CatRAG consistently outperforms state of the art baselines. Our analysis reveals that while standard Recall metrics show modest gains, CatRAG achieves substantial improvements in reasoning completeness, the capacity to recover the entire evidence path without gaps. These results reveal that our approach effectively bridges the gap between retrieving partial context and enabling fully grounded reasoning. Resources are available at https://github.com/kwunhang/CatRAG.