Chain-of-Verification vermindert hallucinatie in grote taalmodellen.

Samenvatting

Het genereren van plausibele maar feitelijk onjuiste informatie, ook wel hallucinatie genoemd, is een onopgelost probleem bij grote taalmodelen. Wij onderzoeken het vermogen van taalmodelen om na te denken over de antwoorden die ze geven om zo hun fouten te corrigeren. We ontwikkelen de Chain-of-Verification (CoVe)-methode, waarbij het model eerst (i) een initieel antwoord opstelt; vervolgens (ii) verificatievragen plant om zijn concept te factchecken; (iii) die vragen onafhankelijk beantwoordt zodat de antwoorden niet beïnvloed worden door andere reacties; en (iv) zijn definitieve, geverifieerde antwoord genereert. In experimenten tonen we aan dat CoVe hallucinaties vermindert bij een verscheidenheid aan taken, van lijstgebaseerde vragen uit Wikidata, gesloten boek MultiSpanQA tot het genereren van lange teksten.

English

Generation of plausible yet incorrect factual information, termed hallucination, is an unsolved issue in large language models. We study the ability of language models to deliberate on the responses they give in order to correct their mistakes. We develop the Chain-of-Verification (CoVe) method whereby the model first (i) drafts an initial response; then (ii) plans verification questions to fact-check its draft; (iii) answers those questions independently so the answers are not biased by other responses; and (iv) generates its final verified response. In experiments, we show CoVe decreases hallucinations across a variety of tasks, from list-based questions from Wikidata, closed book MultiSpanQA and longform text generation.

Chain-of-Verification vermindert hallucinatie in grote taalmodellen.

Chain-of-Verification Reduces Hallucination in Large Language Models

Samenvatting

Support