Jenseits von Wahr oder Falsch: Retrieval-augmentierte hierarchische Analyse differenzierter Behauptungen

papers.abstract

Aussagen von Einzelpersonen oder Organisationen sind oft nuanciert und können nicht eindeutig als vollständig „wahr“ oder „falsch“ klassifiziert werden – wie dies häufig bei wissenschaftlichen und politischen Behauptungen der Fall ist. Eine Aussage (z. B. „Impfstoff A ist besser als Impfstoff B“) kann jedoch in ihre integralen Aspekte und Unteraspekte (z. B. Wirksamkeit, Sicherheit, Verteilung) zerlegt werden, die einzeln leichter zu validieren sind. Dies ermöglicht eine umfassendere, strukturierte Antwort, die eine ausgewogene Perspektive auf ein gegebenes Problem bietet und gleichzeitig dem Leser erlaubt, spezifische Interessensschwerpunkte innerhalb der Aussage zu priorisieren (z. B. Sicherheit gegenüber Kindern). Daher schlagen wir ClaimSpect vor, ein auf retrieval-augmentierter Generierung basierendes Framework, das automatisch eine Hierarchie von Aspekten erstellt, die typischerweise bei der Betrachtung einer Aussage berücksichtigt werden, und diese mit korpusspezifischen Perspektiven anreichert. Diese Struktur unterteilt ein Eingabekorpus hierarchisch, um relevante Segmente zu extrahieren, die bei der Entdeckung neuer Unteraspekte helfen. Darüber hinaus ermöglichen diese Segmente die Identifizierung unterschiedlicher Perspektiven zu einem Aspekt der Aussage (z. B. Unterstützung, Neutralität oder Ablehnung) und deren jeweiliger Verbreitung (z. B. „Wie viele biomedizinische Publikationen glauben, dass Impfstoff A transportabler ist als B?“). Wir wenden ClaimSpect auf eine Vielzahl realer wissenschaftlicher und politischer Aussagen an, die in unserem erstellten Datensatz enthalten sind, und demonstrieren seine Robustheit und Genauigkeit bei der Dekonstruktion einer nuancierten Aussage sowie der Darstellung von Perspektiven innerhalb eines Korpus. Durch reale Fallstudien und menschliche Bewertung validieren wir seine Effektivität im Vergleich zu mehreren Baseline-Methoden.

English

Claims made by individuals or entities are oftentimes nuanced and cannot be clearly labeled as entirely "true" or "false" -- as is frequently the case with scientific and political claims. However, a claim (e.g., "vaccine A is better than vaccine B") can be dissected into its integral aspects and sub-aspects (e.g., efficacy, safety, distribution), which are individually easier to validate. This enables a more comprehensive, structured response that provides a well-rounded perspective on a given problem while also allowing the reader to prioritize specific angles of interest within the claim (e.g., safety towards children). Thus, we propose ClaimSpect, a retrieval-augmented generation-based framework for automatically constructing a hierarchy of aspects typically considered when addressing a claim and enriching them with corpus-specific perspectives. This structure hierarchically partitions an input corpus to retrieve relevant segments, which assist in discovering new sub-aspects. Moreover, these segments enable the discovery of varying perspectives towards an aspect of the claim (e.g., support, neutral, or oppose) and their respective prevalence (e.g., "how many biomedical papers believe vaccine A is more transportable than B?"). We apply ClaimSpect to a wide variety of real-world scientific and political claims featured in our constructed dataset, showcasing its robustness and accuracy in deconstructing a nuanced claim and representing perspectives within a corpus. Through real-world case studies and human evaluation, we validate its effectiveness over multiple baselines.

Jenseits von Wahr oder Falsch: Retrieval-augmentierte hierarchische Analyse differenzierter Behauptungen

Beyond True or False: Retrieval-Augmented Hierarchical Analysis of Nuanced Claims

papers.abstract

Support