LawThinker: Ein tiefenforschendes juristisches Agentensystem in dynamischen Umgebungen
LawThinker: A Deep Research Legal Agent in Dynamic Environments
February 12, 2026
papers.authors: Xinyu Yang, Chenlong Deng, Tongyu Wen, Binyu Xie, Zhicheng Dou
cs.AI
papers.abstract
Juristisches Denken erfordert nicht nur korrekte Ergebnisse, sondern auch verfahrenskonforme Denkprozesse. Bisherige Methoden verfügen jedoch über keine Mechanismen zur Überprüfung von Zwischenschritten, sodass Fehler wie unzutreffende Gesetzeszitate unerkannt durch die Argumentationskette weitergegeben werden können. Um dies zu adressieren, schlagen wir LawThinker vor – einen autonomen juristischen Recherche-Agenten, der eine Explore-Verify-Memorize-Strategie für dynamische Justizumgebungen anwendet. Der Kernansatz besteht darin, die Verifizierung als atomaren Schritt nach jeder Wissenserschließung durchzuführen. Ein DeepVerifier-Modul prüft jedes Rechercheergebnis entlang dreier Dimensionen: Wissensgenauigkeit, Tatsachen-Rechts-Relevanz und Verfahrenskonformität, unterstützt durch ein Gedächtnismodul für wiederverwendbares Wissen in mehrstufigen Aufgaben. Experimente mit der dynamischen Benchmark J1-EVAL zeigen, dass LawThinker eine 24 %ige Verbesserung gegenüber direktem Schließen und 11 % gegenüber workflow-basierten Methoden erzielt, mit besonders deutlichen Verbesserungen bei prozessorientierten Metriken. Evaluierungen auf drei statischen Benchmarks bestätigen seine Generalisierungsfähigkeit. Der Code ist verfügbar unter https://github.com/yxy-919/LawThinker-agent.
English
Legal reasoning requires not only correct outcomes but also procedurally compliant reasoning processes. However, existing methods lack mechanisms to verify intermediate reasoning steps, allowing errors such as inapplicable statute citations to propagate undetected through the reasoning chain. To address this, we propose LawThinker, an autonomous legal research agent that adopts an Explore-Verify-Memorize strategy for dynamic judicial environments. The core idea is to enforce verification as an atomic operation after every knowledge exploration step. A DeepVerifier module examines each retrieval result along three dimensions of knowledge accuracy, fact-law relevance, and procedural compliance, with a memory module for cross-round knowledge reuse in long-horizon tasks. Experiments on the dynamic benchmark J1-EVAL show that LawThinker achieves a 24% improvement over direct reasoning and an 11% gain over workflow-based methods, with particularly strong improvements on process-oriented metrics. Evaluations on three static benchmarks further confirm its generalization capability. The code is available at https://github.com/yxy-919/LawThinker-agent .