ChatPaper.aiChatPaper

La méthode de vérification en chaîne réduit les hallucinations dans les grands modèles de langage.

Chain-of-Verification Reduces Hallucination in Large Language Models

September 20, 2023
Auteurs: Shehzaad Dhuliawala, Mojtaba Komeili, Jing Xu, Roberta Raileanu, Xian Li, Asli Celikyilmaz, Jason Weston
cs.AI

Résumé

La génération d'informations factuelles plausibles mais incorrectes, appelée hallucination, constitue un problème non résolu dans les grands modèles de langage. Nous étudions la capacité des modèles de langage à réfléchir sur les réponses qu'ils donnent afin de corriger leurs erreurs. Nous développons la méthode Chain-of-Verification (CoVe) dans laquelle le modèle (i) rédige d'abord une réponse initiale ; puis (ii) planifie des questions de vérification pour valider son projet de réponse ; (iii) répond à ces questions de manière indépendante afin que les réponses ne soient pas biaisées par d'autres éléments ; et (iv) génère sa réponse finale vérifiée. Dans les expériences, nous montrons que CoVe réduit les hallucinations dans une variété de tâches, allant des questions basées sur des listes issues de Wikidata, au MultiSpanQA en mode fermé, jusqu'à la génération de textes longs.
English
Generation of plausible yet incorrect factual information, termed hallucination, is an unsolved issue in large language models. We study the ability of language models to deliberate on the responses they give in order to correct their mistakes. We develop the Chain-of-Verification (CoVe) method whereby the model first (i) drafts an initial response; then (ii) plans verification questions to fact-check its draft; (iii) answers those questions independently so the answers are not biased by other responses; and (iv) generates its final verified response. In experiments, we show CoVe decreases hallucinations across a variety of tasks, from list-based questions from Wikidata, closed book MultiSpanQA and longform text generation.
PDF396December 15, 2024