HANRAG: Generación Aumentada por Recuperación Heurística, Precisa y Resistente al Ruido para Respuestas a Preguntas de Múltiples Saltos

Resumen

El enfoque de Generación Aumentada por Recuperación (RAG, por sus siglas en inglés) mejora los sistemas de respuesta a preguntas y las tareas de generación de diálogos al integrar tecnologías de recuperación de información (IR) con modelos de lenguaje de gran escala (LLMs). Esta estrategia, que recupera información de bases de conocimiento externas para reforzar las capacidades de respuesta de los modelos generativos, ha logrado ciertos éxitos. Sin embargo, los métodos actuales de RAG aún enfrentan numerosos desafíos al tratar con consultas de múltiples saltos. Por ejemplo, algunos enfoques dependen excesivamente de la recuperación iterativa, desperdiciando demasiados pasos de recuperación en consultas compuestas. Además, el uso de la consulta compleja original para la recuperación puede no capturar contenido relevante para subconsultas específicas, lo que resulta en contenido recuperado ruidoso. Si no se gestiona este ruido, puede conducir al problema de acumulación de ruido. Para abordar estos problemas, presentamos HANRAG, un novedoso marco basado en heurísticas diseñado para resolver eficientemente problemas de diversa complejidad. Impulsado por un potente revelador, HANRAG dirige las consultas, las descompone en subconsultas y filtra el ruido de los documentos recuperados. Esto mejora la adaptabilidad y la resistencia al ruido del sistema, haciéndolo altamente capaz de manejar diversas consultas. Comparamos el marco propuesto con otros métodos líderes de la industria en varios puntos de referencia. Los resultados demuestran que nuestro marco obtiene un rendimiento superior tanto en tareas de respuesta a preguntas de un solo salto como de múltiples saltos.

English

The Retrieval-Augmented Generation (RAG) approach enhances question-answering systems and dialogue generation tasks by integrating information retrieval (IR) technologies with large language models (LLMs). This strategy, which retrieves information from external knowledge bases to bolster the response capabilities of generative models, has achieved certain successes. However, current RAG methods still face numerous challenges when dealing with multi-hop queries. For instance, some approaches overly rely on iterative retrieval, wasting too many retrieval steps on compound queries. Additionally, using the original complex query for retrieval may fail to capture content relevant to specific sub-queries, resulting in noisy retrieved content. If the noise is not managed, it can lead to the problem of noise accumulation. To address these issues, we introduce HANRAG, a novel heuristic-based framework designed to efficiently tackle problems of varying complexity. Driven by a powerful revelator, HANRAG routes queries, decomposes them into sub-queries, and filters noise from retrieved documents. This enhances the system's adaptability and noise resistance, making it highly capable of handling diverse queries. We compare the proposed framework against other leading industry methods across various benchmarks. The results demonstrate that our framework obtains superior performance in both single-hop and multi-hop question-answering tasks.

HANRAG: Generación Aumentada por Recuperación Heurística, Precisa y Resistente al Ruido para Respuestas a Preguntas de Múltiples Saltos

HANRAG: Heuristic Accurate Noise-resistant Retrieval-Augmented Generation for Multi-hop Question Answering

Resumen

Support