HANRAG: Generación Aumentada por Recuperación Heurística, Precisa y Resistente al Ruido para Respuestas a Preguntas de Múltiples Saltos
HANRAG: Heuristic Accurate Noise-resistant Retrieval-Augmented Generation for Multi-hop Question Answering
September 8, 2025
Autores: Duolin Sun, Dan Yang, Yue Shen, Yihan Jiao, Zhehao Tan, Jie Feng, Lianzhen Zhong, Jian Wang, Peng Wei, Jinjie Gu
cs.AI
Resumen
El enfoque de Generación Aumentada por Recuperación (RAG, por sus siglas en inglés) mejora los sistemas de respuesta a preguntas y las tareas de generación de diálogos al integrar tecnologías de recuperación de información (IR) con modelos de lenguaje de gran escala (LLMs). Esta estrategia, que recupera información de bases de conocimiento externas para reforzar las capacidades de respuesta de los modelos generativos, ha logrado ciertos éxitos. Sin embargo, los métodos actuales de RAG aún enfrentan numerosos desafíos al tratar con consultas de múltiples saltos. Por ejemplo, algunos enfoques dependen excesivamente de la recuperación iterativa, desperdiciando demasiados pasos de recuperación en consultas compuestas. Además, el uso de la consulta compleja original para la recuperación puede no capturar contenido relevante para subconsultas específicas, lo que resulta en contenido recuperado ruidoso. Si no se gestiona este ruido, puede conducir al problema de acumulación de ruido. Para abordar estos problemas, presentamos HANRAG, un novedoso marco basado en heurísticas diseñado para resolver eficientemente problemas de diversa complejidad. Impulsado por un potente revelador, HANRAG dirige las consultas, las descompone en subconsultas y filtra el ruido de los documentos recuperados. Esto mejora la adaptabilidad y la resistencia al ruido del sistema, haciéndolo altamente capaz de manejar diversas consultas. Comparamos el marco propuesto con otros métodos líderes de la industria en varios puntos de referencia. Los resultados demuestran que nuestro marco obtiene un rendimiento superior tanto en tareas de respuesta a preguntas de un solo salto como de múltiples saltos.
English
The Retrieval-Augmented Generation (RAG) approach enhances question-answering
systems and dialogue generation tasks by integrating information retrieval (IR)
technologies with large language models (LLMs). This strategy, which retrieves
information from external knowledge bases to bolster the response capabilities
of generative models, has achieved certain successes. However, current RAG
methods still face numerous challenges when dealing with multi-hop queries. For
instance, some approaches overly rely on iterative retrieval, wasting too many
retrieval steps on compound queries. Additionally, using the original complex
query for retrieval may fail to capture content relevant to specific
sub-queries, resulting in noisy retrieved content. If the noise is not managed,
it can lead to the problem of noise accumulation. To address these issues, we
introduce HANRAG, a novel heuristic-based framework designed to efficiently
tackle problems of varying complexity. Driven by a powerful revelator, HANRAG
routes queries, decomposes them into sub-queries, and filters noise from
retrieved documents. This enhances the system's adaptability and noise
resistance, making it highly capable of handling diverse queries. We compare
the proposed framework against other leading industry methods across various
benchmarks. The results demonstrate that our framework obtains superior
performance in both single-hop and multi-hop question-answering tasks.