ProgRAG : Récupération progressive et raisonnement résistant aux hallucinations sur les graphes de connaissances

Résumé

Les modèles de langage de grande taille (LLMs) démontrent de solides capacités de raisonnement mais peinent avec les hallucinations et une transparence limitée. Récemment, les LLMs enrichis par des graphes de connaissances (KGs) ont montré une amélioration des performances de raisonnement, en particulier pour les tâches complexes et riches en connaissances. Cependant, ces méthodes rencontrent encore des défis importants, notamment des récupérations inexactes et des échecs de raisonnement, souvent exacerbés par des contextes d'entrée longs qui obscurcissent les informations pertinentes ou par des constructions de contexte qui peinent à capturer les directions logiques plus riches requises par différents types de questions. De plus, nombre de ces approches reposent sur les LLMs pour récupérer directement des preuves à partir des KGs et pour auto-évaluer la suffisance de ces preuves, ce qui aboutit souvent à un raisonnement prématuré ou incorrect. Pour résoudre les problèmes de récupération et de raisonnement, nous proposons ProgRAG, un cadre de réponse à des questions multi-sauts sur des graphes de connaissances (KGQA) qui décompose les questions complexes en sous-questions et étend progressivement les chemins de raisonnement partiels en répondant à chaque sous-question. À chaque étape, des récupérateurs externes collectent des preuves candidates, qui sont ensuite affinées par une élagage tenant compte de l'incertitude effectué par le LLM. Enfin, le contexte pour le raisonnement du LLM est optimisé en organisant et en réarrangeant les chemins de raisonnement partiels obtenus à partir des réponses aux sous-questions. Les expériences sur trois ensembles de données bien connus démontrent que ProgRAG surpasse les bases de référence existantes en KGQA multi-sauts, offrant une fiabilité et une qualité de raisonnement améliorées.

English

Large Language Models (LLMs) demonstrate strong reasoning capabilities but struggle with hallucinations and limited transparency. Recently, KG-enhanced LLMs that integrate knowledge graphs (KGs) have been shown to improve reasoning performance, particularly for complex, knowledge-intensive tasks. However, these methods still face significant challenges, including inaccurate retrieval and reasoning failures, often exacerbated by long input contexts that obscure relevant information or by context constructions that struggle to capture the richer logical directions required by different question types. Furthermore, many of these approaches rely on LLMs to directly retrieve evidence from KGs, and to self-assess the sufficiency of this evidence, which often results in premature or incorrect reasoning. To address the retrieval and reasoning failures, we propose ProgRAG, a multi-hop knowledge graph question answering (KGQA) framework that decomposes complex questions into sub-questions, and progressively extends partial reasoning paths by answering each sub-question. At each step, external retrievers gather candidate evidence, which is then refined through uncertainty-aware pruning by the LLM. Finally, the context for LLM reasoning is optimized by organizing and rearranging the partial reasoning paths obtained from the sub-question answers. Experiments on three well-known datasets demonstrate that ProgRAG outperforms existing baselines in multi-hop KGQA, offering improved reliability and reasoning quality.

ProgRAG : Récupération progressive et raisonnement résistant aux hallucinations sur les graphes de connaissances

ProgRAG: Hallucination-Resistant Progressive Retrieval and Reasoning over Knowledge Graphs

Résumé

Support