ChatPaper.aiChatPaper

A Cadeia de Verificação Reduz Alucinações em Modelos de Linguagem de Grande Escala

Chain-of-Verification Reduces Hallucination in Large Language Models

September 20, 2023
Autores: Shehzaad Dhuliawala, Mojtaba Komeili, Jing Xu, Roberta Raileanu, Xian Li, Asli Celikyilmaz, Jason Weston
cs.AI

Resumo

A geração de informações factuais plausíveis, porém incorretas, denominada alucinação, é um problema não resolvido em modelos de linguagem de grande escala. Estudamos a capacidade dos modelos de linguagem de refletir sobre as respostas que fornecem para corrigir seus erros. Desenvolvemos o método Chain-of-Verification (CoVe), no qual o modelo primeiro (i) elabora uma resposta inicial; em seguida, (ii) planeja perguntas de verificação para checar os fatos de seu rascunho; (iii) responde a essas perguntas de forma independente, para que as respostas não sejam influenciadas por outras; e (iv) gera sua resposta final verificada. Em experimentos, mostramos que o CoVe reduz as alucinações em uma variedade de tarefas, desde perguntas baseadas em listas do Wikidata, MultiSpanQA de livro fechado e geração de textos longos.
English
Generation of plausible yet incorrect factual information, termed hallucination, is an unsolved issue in large language models. We study the ability of language models to deliberate on the responses they give in order to correct their mistakes. We develop the Chain-of-Verification (CoVe) method whereby the model first (i) drafts an initial response; then (ii) plans verification questions to fact-check its draft; (iii) answers those questions independently so the answers are not biased by other responses; and (iv) generates its final verified response. In experiments, we show CoVe decreases hallucinations across a variety of tasks, from list-based questions from Wikidata, closed book MultiSpanQA and longform text generation.
PDF396February 8, 2026