LawThinker: Un Agente Legale di Approfondimento in Ambienti Dinamici

Abstract

Il ragionamento giuridico richiede non solo esiti corretti, ma anche processi argomentativi proceduralmente conformi. Tuttavia, i metodi esistenti mancano di meccanismi per verificare i passaggi intermedi del ragionamento, consentendo a errori come citazioni normative inapplicabili di propagarsi inosservati attraverso la catena argomentativa. Per ovviare a ciò, proponiamo LawThinker, un agente autonomo di ricerca giuridica che adotta una strategia Esplora-Verifica-Memorizza per ambienti giudiziari dinamici. L'idea centrale è imporre la verifica come operazione atomica dopo ogni fase di esplorazione della conoscenza. Un modulo DeepVerifier esamina ogni risultato di recupero lungo tre dimensioni: accuratezza della conoscenza, rilevanza fatto-norma e conformità procedurale, con un modulo di memoria per il riutilizzo transazionale della conoscenza in compiti a lungo termine. Gli esperimenti sul benchmark dinamico J1-EVAL mostrano che LawThinker ottiene un miglioramento del 24% rispetto al ragionamento diretto e un guadagno dell'11% rispetto ai metodi basati su workflow, con progressi particolarmente significativi sulle metriche orientate al processo. Le valutazioni su tre benchmark statici ne confermano ulteriormente la capacità di generalizzazione. Il codice è disponibile all'indirizzo https://github.com/yxy-919/LawThinker-agent.

English

Legal reasoning requires not only correct outcomes but also procedurally compliant reasoning processes. However, existing methods lack mechanisms to verify intermediate reasoning steps, allowing errors such as inapplicable statute citations to propagate undetected through the reasoning chain. To address this, we propose LawThinker, an autonomous legal research agent that adopts an Explore-Verify-Memorize strategy for dynamic judicial environments. The core idea is to enforce verification as an atomic operation after every knowledge exploration step. A DeepVerifier module examines each retrieval result along three dimensions of knowledge accuracy, fact-law relevance, and procedural compliance, with a memory module for cross-round knowledge reuse in long-horizon tasks. Experiments on the dynamic benchmark J1-EVAL show that LawThinker achieves a 24% improvement over direct reasoning and an 11% gain over workflow-based methods, with particularly strong improvements on process-oriented metrics. Evaluations on three static benchmarks further confirm its generalization capability. The code is available at https://github.com/yxy-919/LawThinker-agent .

LawThinker: Un Agente Legale di Approfondimento in Ambienti Dinamici

LawThinker: A Deep Research Legal Agent in Dynamic Environments

Abstract

Support