ChatPaper.aiChatPaper

Verifica dei Fatti Basata su Prove Utilizzando RAG e Apprendimento In-Context con Pochi Esempi nei Modelli Linguistici di Grande Dimensione

Evidence-backed Fact Checking using RAG and Few-Shot In-Context Learning with LLMs

August 22, 2024
Autori: Ronit Singhal, Pransh Patwa, Parth Patwa, Aman Chadha, Amitava Das
cs.AI

Abstract

Considerando la diffusa disseminazione di disinformazione sui social media, l'implementazione di meccanismi di fact-checking per le affermazioni online è essenziale. Verificare manualmente ogni affermazione è estremamente impegnativo, sottolineando la necessità di un sistema automatizzato di fact-checking. Questo articolo presenta il nostro sistema progettato per affrontare questo problema. Utilizziamo il dataset Averitec per valutare la veridicità delle affermazioni. Oltre alla previsione della veridicità, il nostro sistema fornisce prove a supporto, estratte dal dataset. Sviluppiamo una pipeline Retrieve and Generate (RAG) per estrarre frasi di prova rilevanti da una base di conoscenza, che vengono poi inserite insieme all'affermazione in un modello linguistico di grandi dimensioni (LLM) per la classificazione. Valutiamo inoltre le capacità di apprendimento in contesto few-shot (ICL) di più LLM. Il nostro sistema raggiunge un punteggio 'Averitec' di 0.33, che rappresenta un miglioramento assoluto del 22% rispetto alla baseline. Tutto il codice sarà reso disponibile su https://github.com/ronit-singhal/evidence-backed-fact-checking-using-rag-and-few-shot-in-context-learning-with-llms.
English
Given the widespread dissemination of misinformation on social media, implementing fact-checking mechanisms for online claims is essential. Manually verifying every claim is highly challenging, underscoring the need for an automated fact-checking system. This paper presents our system designed to address this issue. We utilize the Averitec dataset to assess the veracity of claims. In addition to veracity prediction, our system provides supporting evidence, which is extracted from the dataset. We develop a Retrieve and Generate (RAG) pipeline to extract relevant evidence sentences from a knowledge base, which are then inputted along with the claim into a large language model (LLM) for classification. We also evaluate the few-shot In-Context Learning (ICL) capabilities of multiple LLMs. Our system achieves an 'Averitec' score of 0.33, which is a 22% absolute improvement over the baseline. All code will be made available on All code will be made available on https://github.com/ronit-singhal/evidence-backed-fact-checking-using-rag-and-few-shot-in-context-learning-with-llms.
PDF63November 16, 2024