Faktenüberprüfung mit Unterstützung von Beweisen unter Verwendung von RAG und Few-Shot In-Context Learning mit LLMs.
Evidence-backed Fact Checking using RAG and Few-Shot In-Context Learning with LLMs
August 22, 2024
Autoren: Ronit Singhal, Pransh Patwa, Parth Patwa, Aman Chadha, Amitava Das
cs.AI
Zusammenfassung
Angesichts der weit verbreiteten Verbreitung von Fehlinformationen in sozialen Medien ist die Implementierung von Faktenprüfmechanismen für Online-Behauptungen unerlässlich. Jede Behauptung manuell zu überprüfen, ist äußerst herausfordernd und unterstreicht die Notwendigkeit eines automatisierten Faktenprüfungssystems. Dieses Papier stellt unser System vor, das entwickelt wurde, um dieses Problem anzugehen. Wir nutzen den Averitec-Datensatz, um die Wahrhaftigkeit von Behauptungen zu bewerten. Neben der Wahrheitsvorhersage liefert unser System unterstützende Beweise, die aus dem Datensatz extrahiert werden. Wir entwickeln eine Abruf- und Generierungspipeline (RAG), um relevante Beweissätze aus einer Wissensdatenbank zu extrahieren, die dann zusammen mit der Behauptung in ein großes Sprachmodell (LLM) zur Klassifizierung eingegeben werden. Wir evaluieren auch die Few-Shot In-Context Learning (ICL) Fähigkeiten mehrerer LLMs. Unser System erreicht einen „Averitec“-Score von 0,33, was eine absolute Verbesserung um 22% gegenüber dem Ausgangswert darstellt. Der gesamte Code wird auf https://github.com/ronit-singhal/evidence-backed-fact-checking-using-rag-and-few-shot-in-context-learning-with-llms verfügbar sein.
English
Given the widespread dissemination of misinformation on social media,
implementing fact-checking mechanisms for online claims is essential. Manually
verifying every claim is highly challenging, underscoring the need for an
automated fact-checking system. This paper presents our system designed to
address this issue. We utilize the Averitec dataset to assess the veracity of
claims. In addition to veracity prediction, our system provides supporting
evidence, which is extracted from the dataset. We develop a Retrieve and
Generate (RAG) pipeline to extract relevant evidence sentences from a knowledge
base, which are then inputted along with the claim into a large language model
(LLM) for classification. We also evaluate the few-shot In-Context Learning
(ICL) capabilities of multiple LLMs. Our system achieves an 'Averitec' score of
0.33, which is a 22% absolute improvement over the baseline. All code will be
made available on All code will be made available on
https://github.com/ronit-singhal/evidence-backed-fact-checking-using-rag-and-few-shot-in-context-learning-with-llms.Summary
AI-Generated Summary