Chain-of-Verification vermindert hallucinatie in grote taalmodellen.
Chain-of-Verification Reduces Hallucination in Large Language Models
September 20, 2023
Auteurs: Shehzaad Dhuliawala, Mojtaba Komeili, Jing Xu, Roberta Raileanu, Xian Li, Asli Celikyilmaz, Jason Weston
cs.AI
Samenvatting
Het genereren van plausibele maar feitelijk onjuiste informatie, ook wel hallucinatie genoemd, is een onopgelost probleem bij grote taalmodelen. Wij onderzoeken het vermogen van taalmodelen om na te denken over de antwoorden die ze geven om zo hun fouten te corrigeren. We ontwikkelen de Chain-of-Verification (CoVe)-methode, waarbij het model eerst (i) een initieel antwoord opstelt; vervolgens (ii) verificatievragen plant om zijn concept te factchecken; (iii) die vragen onafhankelijk beantwoordt zodat de antwoorden niet beïnvloed worden door andere reacties; en (iv) zijn definitieve, geverifieerde antwoord genereert. In experimenten tonen we aan dat CoVe hallucinaties vermindert bij een verscheidenheid aan taken, van lijstgebaseerde vragen uit Wikidata, gesloten boek MultiSpanQA tot het genereren van lange teksten.
English
Generation of plausible yet incorrect factual information, termed
hallucination, is an unsolved issue in large language models. We study the
ability of language models to deliberate on the responses they give in order to
correct their mistakes. We develop the Chain-of-Verification (CoVe) method
whereby the model first (i) drafts an initial response; then (ii) plans
verification questions to fact-check its draft; (iii) answers those questions
independently so the answers are not biased by other responses; and (iv)
generates its final verified response. In experiments, we show CoVe decreases
hallucinations across a variety of tasks, from list-based questions from
Wikidata, closed book MultiSpanQA and longform text generation.