Цепочка проверки снижает галлюцинации в больших языковых моделях.
Chain-of-Verification Reduces Hallucination in Large Language Models
September 20, 2023
Авторы: Shehzaad Dhuliawala, Mojtaba Komeili, Jing Xu, Roberta Raileanu, Xian Li, Asli Celikyilmaz, Jason Weston
cs.AI
Аннотация
Генерация правдоподобной, но фактически неверной информации, называемая галлюцинацией, остается нерешенной проблемой в больших языковых моделях. Мы исследуем способность языковых моделей анализировать свои ответы с целью исправления ошибок. Мы разработали метод "Цепочка проверки" (Chain-of-Verification, CoVe), в рамках которого модель сначала (i) создает черновой ответ; затем (ii) формулирует проверочные вопросы для подтверждения достоверности черновика; (iii) отвечает на эти вопросы независимо, чтобы ответы не были искажены другими данными; и (iv) генерирует окончательный проверенный ответ. В экспериментах мы показываем, что CoVe снижает количество галлюцинаций в различных задачах, включая вопросы на основе списков из Wikidata, закрытые вопросы MultiSpanQA и генерацию длинных текстов.
English
Generation of plausible yet incorrect factual information, termed
hallucination, is an unsolved issue in large language models. We study the
ability of language models to deliberate on the responses they give in order to
correct their mistakes. We develop the Chain-of-Verification (CoVe) method
whereby the model first (i) drafts an initial response; then (ii) plans
verification questions to fact-check its draft; (iii) answers those questions
independently so the answers are not biased by other responses; and (iv)
generates its final verified response. In experiments, we show CoVe decreases
hallucinations across a variety of tasks, from list-based questions from
Wikidata, closed book MultiSpanQA and longform text generation.