ChatPaper.aiChatPaper

정적 그래프의 한계 극복: 강건한 검색 증강 생성을 위한 맥락 인식 탐색

Breaking the Static Graph: Context-Aware Traversal for Robust Retrieval-Augmented Generation

February 2, 2026
저자: Kwun Hang Lau, Fangyuan Zhang, Boyu Ruan, Yingli Zhou, Qintian Guo, Ruiyuan Zhang, Xiaofang Zhou
cs.AI

초록

최근 검색 증강 생성(RAG) 분야에서는 단순한 벡터 유사도를 넘어 지식 그래프(KG)와 개인화 페이지랭크(PPR)를 활용해 다중 홉 의존성을 포착하는 HippoRAG와 같은 구조 인식 접근법으로 발전하고 있습니다. 그러나 이러한 방법들은 인덱싱 과정에서 결정된 고정된 전이 확률에 의존하는 "정적 그래프 오류"라는 한계를 지닙니다. 이러한 경직성은 간선 관련성이 쿼리에 따라 달라지는 특성을 무시함으로써, 중요한 하류 증거에 도달하기 전에 무작위 행보가 높은 차수의 '허브' 노드로 빗나가는 의미적 편차를 초래합니다. 그 결과 모델은 부분 재현율은 높게 달성하지만 다중 홉 질의에 필요한 완전한 증거 사슬을 검색하지 못하는 경우가 많습니다. 이를 해결하기 위해 우리는 HippoRAG 2 아키텍처를 기반으로 정적 KG를 쿼리 적응형 탐색 구조로 변환하는 프레임워크인 CatRAG(맥락 인식 탐색)를 제안합니다. 우리는 무작위 행보를 조종하기 위한 다각적 프레임워크를 도입했습니다: (1) 무작위 행보를 규제하기 위한 약한 개체 제약 조건을 주입하는 기호 정착, (2) 그래프 구조를 동적으로 조절하여 쿼리 의도와 일치하는 경로는 증폭시키면서 관련 없는 경로는 제거하는 쿼리 인식 동적 간선 가중치 부여, 그리고 (3) 무작위 행보를 가능성 있는 증거에 구조적으로 정착시키는 비용 효율적 편향인 핵심 사실 문단 가중치 강화입니다. 4개의 다중 홉 벤치마크에서 진행한 실험 결과, CatRAG가 최신 기준선을 지속적으로 능가하는 것으로 나타났습니다. 우리의 분석에 따르면 표준 재현율 지표는 소폭의 향상만 보였지만, CatRAG는 증거 경로 전체를 누락 없히 복원하는 능력인 추론 완전성에서 상당한 개선을 달성했습니다. 이러한 결과는 우리의 접근 방식이 부분적 맥락 검색과 완전히 근거 기반 추론 가능 사이의 격차를 효과적으로 해소함을 보여줍니다. 관련 자료는 https://github.com/kwunhang/CatRAG에서 확인할 수 있습니다.
English
Recent advances in Retrieval-Augmented Generation (RAG) have shifted from simple vector similarity to structure-aware approaches like HippoRAG, which leverage Knowledge Graphs (KGs) and Personalized PageRank (PPR) to capture multi-hop dependencies. However, these methods suffer from a "Static Graph Fallacy": they rely on fixed transition probabilities determined during indexing. This rigidity ignores the query-dependent nature of edge relevance, causing semantic drift where random walks are diverted into high-degree "hub" nodes before reaching critical downstream evidence. Consequently, models often achieve high partial recall but fail to retrieve the complete evidence chain required for multi-hop queries. To address this, we propose CatRAG, Context-Aware Traversal for robust RAG, a framework that builds on the HippoRAG 2 architecture and transforms the static KG into a query-adaptive navigation structure. We introduce a multi-faceted framework to steer the random walk: (1) Symbolic Anchoring, which injects weak entity constraints to regularize the random walk; (2) Query-Aware Dynamic Edge Weighting, which dynamically modulates graph structure, to prune irrelevant paths while amplifying those aligned with the query's intent; and (3) Key-Fact Passage Weight Enhancement, a cost-efficient bias that structurally anchors the random walk to likely evidence. Experiments across four multi-hop benchmarks demonstrate that CatRAG consistently outperforms state of the art baselines. Our analysis reveals that while standard Recall metrics show modest gains, CatRAG achieves substantial improvements in reasoning completeness, the capacity to recover the entire evidence path without gaps. These results reveal that our approach effectively bridges the gap between retrieving partial context and enabling fully grounded reasoning. Resources are available at https://github.com/kwunhang/CatRAG.
PDF43February 7, 2026