ChatPaper.aiChatPaper

HANRAG: 다중 홉 질의 응답을 위한 휴리스틱 정확도 및 노이즈 저항성 검색 증강 생성

HANRAG: Heuristic Accurate Noise-resistant Retrieval-Augmented Generation for Multi-hop Question Answering

September 8, 2025
저자: Duolin Sun, Dan Yang, Yue Shen, Yihan Jiao, Zhehao Tan, Jie Feng, Lianzhen Zhong, Jian Wang, Peng Wei, Jinjie Gu
cs.AI

초록

검색 증강 생성(Retrieval-Augmented Generation, RAG) 접근법은 정보 검색(Information Retrieval, IR) 기술과 대규모 언어 모델(Large Language Models, LLMs)을 통합하여 질문-응답 시스템과 대화 생성 작업의 성능을 향상시킵니다. 이 전략은 외부 지식 기반에서 정보를 검색하여 생성 모델의 응답 능력을 강화하는 방식으로, 일정한 성공을 거두었습니다. 그러나 현재의 RAG 방법들은 다중 홉(multi-hop) 질의를 처리할 때 여전히 많은 어려움에 직면하고 있습니다. 예를 들어, 일부 접근법은 반복적인 검색에 지나치게 의존함으로써 복합 질의에 너무 많은 검색 단계를 낭비합니다. 또한, 원본의 복잡한 질의를 그대로 검색에 사용할 경우 특정 하위 질의와 관련된 내용을 포착하지 못해 노이즈가 많은 검색 결과를 얻을 수 있습니다. 이러한 노이즈가 제대로 관리되지 않으면 노이즈 누적 문제로 이어질 수 있습니다. 이러한 문제를 해결하기 위해, 우리는 다양한 복잡도의 문제를 효율적으로 처리하기 위해 설계된 새로운 휴리스틱 기반 프레임워크인 HANRAG를 소개합니다. 강력한 리벨레이터(revelator)에 의해 구동되는 HANRAG는 질의를 라우팅하고, 이를 하위 질의로 분해하며, 검색된 문서에서 노이즈를 필터링합니다. 이를 통해 시스템의 적응성과 노이즈 저항성을 강화하여 다양한 질의를 효과적으로 처리할 수 있게 합니다. 우리는 제안된 프레임워크를 다양한 벤치마크에서 다른 선도적인 산업 방법들과 비교했습니다. 그 결과, 우리의 프레임워크가 단일 홉(single-hop) 및 다중 홉 질문-응답 작업 모두에서 우수한 성능을 보임을 확인했습니다.
English
The Retrieval-Augmented Generation (RAG) approach enhances question-answering systems and dialogue generation tasks by integrating information retrieval (IR) technologies with large language models (LLMs). This strategy, which retrieves information from external knowledge bases to bolster the response capabilities of generative models, has achieved certain successes. However, current RAG methods still face numerous challenges when dealing with multi-hop queries. For instance, some approaches overly rely on iterative retrieval, wasting too many retrieval steps on compound queries. Additionally, using the original complex query for retrieval may fail to capture content relevant to specific sub-queries, resulting in noisy retrieved content. If the noise is not managed, it can lead to the problem of noise accumulation. To address these issues, we introduce HANRAG, a novel heuristic-based framework designed to efficiently tackle problems of varying complexity. Driven by a powerful revelator, HANRAG routes queries, decomposes them into sub-queries, and filters noise from retrieved documents. This enhances the system's adaptability and noise resistance, making it highly capable of handling diverse queries. We compare the proposed framework against other leading industry methods across various benchmarks. The results demonstrate that our framework obtains superior performance in both single-hop and multi-hop question-answering tasks.
PDF247September 15, 2025