LawThinker: Een Diepgaand Onderzoekende Juridische Agent in Dynamische Omgevingen

Samenvatting

Juridische redenering vereist niet alleen correcte uitkomsten, maar ook procedureel conforme denkprocessen. Bestaande methoden missen echter mechanismen om tussentijdse redeneerstappen te verifiëren, waardoor fouten zoals ontoepasselijke wetsverwijzingen onopgemerkt door de redeneerketen kunnen voortplanten. Om dit aan te pakken, presenteren wij LawThinker, een autonome juridische onderzoeksagent die een Verkennen-Verifiëren-Onthouden strategie hanteert voor dynamische juridische omgevingen. De kernidee is om verificatie als een atomische operatie af te dwingen na elke stap van kennisverkenning. Een DeepVerifier-module onderzoekt elk retrieved resultaat langs drie dimensies: kennisnauwkeurigheid, feit-recht relevantie en procedurele conformiteit, ondersteund door een geheugenmodule voor kruisronde kennishergebruik bij langlopende taken. Experimenten op de dynamische benchmark J1-EVAL tonen aan dat LawThinker een verbetering van 24% bereikt ten opzichte van direct redeneren en 11% wint op workflow-gebaseerde methoden, met bijzonder sterke verbeteringen op procesgerichte metrieken. Evaluaties op drie statische benchmarks bevestigen verder diens generalisatievermogen. De code is beschikbaar op https://github.com/yxy-919/LawThinker-agent.

English

Legal reasoning requires not only correct outcomes but also procedurally compliant reasoning processes. However, existing methods lack mechanisms to verify intermediate reasoning steps, allowing errors such as inapplicable statute citations to propagate undetected through the reasoning chain. To address this, we propose LawThinker, an autonomous legal research agent that adopts an Explore-Verify-Memorize strategy for dynamic judicial environments. The core idea is to enforce verification as an atomic operation after every knowledge exploration step. A DeepVerifier module examines each retrieval result along three dimensions of knowledge accuracy, fact-law relevance, and procedural compliance, with a memory module for cross-round knowledge reuse in long-horizon tasks. Experiments on the dynamic benchmark J1-EVAL show that LawThinker achieves a 24% improvement over direct reasoning and an 11% gain over workflow-based methods, with particularly strong improvements on process-oriented metrics. Evaluations on three static benchmarks further confirm its generalization capability. The code is available at https://github.com/yxy-919/LawThinker-agent .

LawThinker: Een Diepgaand Onderzoekende Juridische Agent in Dynamische Omgevingen

LawThinker: A Deep Research Legal Agent in Dynamic Environments

Samenvatting

Support