ChatPaper.aiChatPaper

Optimalisatie van decompositie voor optimale claimverificatie

Optimizing Decomposition for Optimal Claim Verification

March 19, 2025
Auteurs: Yining Lu, Noah Ziems, Hy Dang, Meng Jiang
cs.AI

Samenvatting

Huidig onderzoek naar het Decompose-Then-Verify paradigma voor het evalueren van de feitelijkheid van lange teksten behandelt decompositie en verificatie doorgaans in isolatie, waarbij de interacties en mogelijke misalignering over het hoofd worden gezien. We constateren dat bestaande decompositiebeleidsregels, meestal handmatig gemaakte demonstraties, niet goed aansluiten bij downstream verificatoren in termen van atomiciteit -- een nieuwe maatstaf die de informatiedichtheid kwantificeert -- wat leidt tot suboptimale verificatieresultaten. We formuleren het vinden van het optimale decompositiebeleid voor optimale verificatie als een bilevel optimalisatieprobleem. Om een oplossing voor dit sterk NP-moeilijke probleem te benaderen, stellen we dynamische decompositie voor, een reinforcement learning raamwerk dat gebruikmaakt van feedback van de verificator om een beleid te leren voor het dynamisch decomponeren van claims naar de door de verificator geprefereerde atomiciteit. Experimentele resultaten tonen aan dat dynamische decompositie bestaande decompositiebeleidsregels overtreft, waarbij het verificatievertrouwen met 0,07 en de nauwkeurigheid met 0,12 (op een schaal van 0-1) gemiddeld verbetert over verschillende verificatoren, datasets en atomiciteiten van inputclaims.
English
Current research on the Decompose-Then-Verify paradigm for evaluating the factuality of long-form text typically treats decomposition and verification in isolation, overlooking their interactions and potential misalignment. We find that existing decomposition policies, typically hand-crafted demonstrations, do not align well with downstream verifiers in terms of atomicity -- a novel metric quantifying information density -- leading to suboptimal verification results. We formulate finding the optimal decomposition policy for optimal verification as a bilevel optimization problem. To approximate a solution for this strongly NP-hard problem, we propose dynamic decomposition, a reinforcement learning framework that leverages verifier feedback to learn a policy for dynamically decomposing claims to verifier-preferred atomicity. Experimental results show that dynamic decomposition outperforms existing decomposition policies, improving verification confidence by 0.07 and accuracy by 0.12 (on a 0-1 scale) on average across varying verifiers, datasets, and atomcities of input claims.

Summary

AI-Generated Summary

PDF192March 20, 2025