ChatPaper.aiChatPaper

静的グラフの限界を超えて:ロバストな検索拡張生成のための文脈対応トラバーサル

Breaking the Static Graph: Context-Aware Traversal for Robust Retrieval-Augmented Generation

February 2, 2026
著者: Kwun Hang Lau, Fangyuan Zhang, Boyu Ruan, Yingli Zhou, Qintian Guo, Ruiyuan Zhang, Xiaofang Zhou
cs.AI

要旨

検索拡張生成(RAG)の最近の進展は、単純なベクトル類似性から、知識グラフ(KG)とPersonalized PageRank(PPR)を利用してマルチホップ依存関係を捕捉するHippoRAGのような構造認識アプローチへと移行している。しかし、これらの手法は「静的グラフの誤謬」に悩まされている。すなわち、インデックス作成時に決定された固定の遷移確率に依存するため、エッジの関連性がクエリに依存する性質を無視し、ランダムウォークが重要な下流の証拠に到達する前に高次数の「ハブ」ノードに逸脱する意味的ドリフトを引き起こす。その結果、モデルは高い部分的な再現率を達成するが、マルチホップクエリに必要な完全な証拠連鎖を検索できないことが多い。この問題に対処するため、我々はHippoRAG 2アーキテクチャを基盤とし、静的KGをクエリ適応型のナビゲーション構造に変換するフレームワーク「CatRAG:文脈認識トラバーサルによる頑健なRAG」を提案する。本フレームワークでは、ランダムウォークを誘導する多面的なアプローチを導入する。(1)弱いエンティティ制約を注入してランダムウォークを正則化する「記号的アンカリング」、(2)グラフ構造を動的に調整し、クエリの意図に沿った経路を増幅しながら無関係な経路を刈り込む「クエリ認識型動的エッジ重み付け」、(3)ランダムウォークを証拠となり得る部分に構造的に固定するコスト効率の良いバイアスである「重要事実パッセージ重み強化」である。4つのマルチホップベンチマークによる実験では、CatRAGが一貫して最新のベースライン手法を上回ることを示した。分析の結果、標準的な再現率指標ではわずかな向上に留まる一方で、CatRAGは推論の完全性、すなわち証拠経路全体を欠落なく復元する能力において大幅な改善を達成することが明らかになった。これらの結果は、我々のアプローチが部分的な文脈の検索と完全に接地された推論の実現との間のギャップを効果的に埋めるものであることを示している。リソースはhttps://github.com/kwunhang/CatRAG で公開されている。
English
Recent advances in Retrieval-Augmented Generation (RAG) have shifted from simple vector similarity to structure-aware approaches like HippoRAG, which leverage Knowledge Graphs (KGs) and Personalized PageRank (PPR) to capture multi-hop dependencies. However, these methods suffer from a "Static Graph Fallacy": they rely on fixed transition probabilities determined during indexing. This rigidity ignores the query-dependent nature of edge relevance, causing semantic drift where random walks are diverted into high-degree "hub" nodes before reaching critical downstream evidence. Consequently, models often achieve high partial recall but fail to retrieve the complete evidence chain required for multi-hop queries. To address this, we propose CatRAG, Context-Aware Traversal for robust RAG, a framework that builds on the HippoRAG 2 architecture and transforms the static KG into a query-adaptive navigation structure. We introduce a multi-faceted framework to steer the random walk: (1) Symbolic Anchoring, which injects weak entity constraints to regularize the random walk; (2) Query-Aware Dynamic Edge Weighting, which dynamically modulates graph structure, to prune irrelevant paths while amplifying those aligned with the query's intent; and (3) Key-Fact Passage Weight Enhancement, a cost-efficient bias that structurally anchors the random walk to likely evidence. Experiments across four multi-hop benchmarks demonstrate that CatRAG consistently outperforms state of the art baselines. Our analysis reveals that while standard Recall metrics show modest gains, CatRAG achieves substantial improvements in reasoning completeness, the capacity to recover the entire evidence path without gaps. These results reveal that our approach effectively bridges the gap between retrieving partial context and enabling fully grounded reasoning. Resources are available at https://github.com/kwunhang/CatRAG.
PDF43February 7, 2026