HANRAG : Génération Augmentée par Récupération Heuristique, Précise et Résistante au Bruit pour le Question-Réponse Multi-étapes
HANRAG: Heuristic Accurate Noise-resistant Retrieval-Augmented Generation for Multi-hop Question Answering
September 8, 2025
papers.authors: Duolin Sun, Dan Yang, Yue Shen, Yihan Jiao, Zhehao Tan, Jie Feng, Lianzhen Zhong, Jian Wang, Peng Wei, Jinjie Gu
cs.AI
papers.abstract
L'approche de Génération Augmentée par Récupération (RAG) améliore les systèmes de réponse aux questions et les tâches de génération de dialogue en intégrant des technologies de récupération d'information (IR) avec des modèles de langage de grande taille (LLMs). Cette stratégie, qui récupère des informations à partir de bases de connaissances externes pour renforcer les capacités de réponse des modèles génératifs, a obtenu certains succès. Cependant, les méthodes RAG actuelles rencontrent encore de nombreux défis lorsqu'elles traitent des requêtes multi-sauts. Par exemple, certaines approches reposent trop sur une récupération itérative, gaspillant trop d'étapes de récupération pour des requêtes complexes. De plus, l'utilisation de la requête complexe originale pour la récupération peut échouer à capturer le contenu pertinent à des sous-requêtes spécifiques, entraînant un contenu récupéré bruyant. Si ce bruit n'est pas géré, il peut conduire au problème d'accumulation de bruit. Pour résoudre ces problèmes, nous introduisons HANRAG, un nouveau cadre heuristique conçu pour traiter efficacement des problèmes de complexité variable. Guidé par un puissant révélateur, HANRAG achemine les requêtes, les décompose en sous-requêtes et filtre le bruit des documents récupérés. Cela améliore l'adaptabilité du système et sa résistance au bruit, le rendant très capable de gérer des requêtes diverses. Nous comparons le cadre proposé à d'autres méthodes de pointe de l'industrie sur divers benchmarks. Les résultats démontrent que notre cadre obtient des performances supérieures dans les tâches de réponse aux questions à un saut et à plusieurs sauts.
English
The Retrieval-Augmented Generation (RAG) approach enhances question-answering
systems and dialogue generation tasks by integrating information retrieval (IR)
technologies with large language models (LLMs). This strategy, which retrieves
information from external knowledge bases to bolster the response capabilities
of generative models, has achieved certain successes. However, current RAG
methods still face numerous challenges when dealing with multi-hop queries. For
instance, some approaches overly rely on iterative retrieval, wasting too many
retrieval steps on compound queries. Additionally, using the original complex
query for retrieval may fail to capture content relevant to specific
sub-queries, resulting in noisy retrieved content. If the noise is not managed,
it can lead to the problem of noise accumulation. To address these issues, we
introduce HANRAG, a novel heuristic-based framework designed to efficiently
tackle problems of varying complexity. Driven by a powerful revelator, HANRAG
routes queries, decomposes them into sub-queries, and filters noise from
retrieved documents. This enhances the system's adaptability and noise
resistance, making it highly capable of handling diverse queries. We compare
the proposed framework against other leading industry methods across various
benchmarks. The results demonstrate that our framework obtains superior
performance in both single-hop and multi-hop question-answering tasks.