ChatPaper.aiChatPaper

LawThinker: 動的環境における深層研究法務エージェント

LawThinker: A Deep Research Legal Agent in Dynamic Environments

February 12, 2026
著者: Xinyu Yang, Chenlong Deng, Tongyu Wen, Binyu Xie, Zhicheng Dou
cs.AI

要旨

法的推論には、正しい結論のみならず、手続きに準拠した推論プロセスが求められる。しかし既存手法では、中間推論ステップを検証する仕組みが不足しており、不適用法令の引用などの誤りが推論連鎖内で検出されず伝播する可能性がある。この課題に対処するため、我々は動的な司法環境向けに「探索-検証-記憶」戦略を採用する自律的法律研究エージェントLawThinkerを提案する。核となる考え方は、知識探索ステップごとに検証を不可分操作として強制実行することである。DeepVerifierモジュールが各検索結果を、知識正確性・事実と法令の関連性・手続き準拠性の3次元で検査し、長期タスクにおける複数ラウンド間の知識再利用のためにメモリモジュールを備える。動的ベンチマークJ1-EVALでの実験では、LawThinkerが直接推論より24%、ワークフロー型手法より11%性能向上し、プロセス指向指標で特に顕著な改善を示した。3つの静的ベンチマークでの評価でも一般化能力が確認された。コードはhttps://github.com/yxy-919/LawThinker-agent で公開されている。
English
Legal reasoning requires not only correct outcomes but also procedurally compliant reasoning processes. However, existing methods lack mechanisms to verify intermediate reasoning steps, allowing errors such as inapplicable statute citations to propagate undetected through the reasoning chain. To address this, we propose LawThinker, an autonomous legal research agent that adopts an Explore-Verify-Memorize strategy for dynamic judicial environments. The core idea is to enforce verification as an atomic operation after every knowledge exploration step. A DeepVerifier module examines each retrieval result along three dimensions of knowledge accuracy, fact-law relevance, and procedural compliance, with a memory module for cross-round knowledge reuse in long-horizon tasks. Experiments on the dynamic benchmark J1-EVAL show that LawThinker achieves a 24% improvement over direct reasoning and an 11% gain over workflow-based methods, with particularly strong improvements on process-oriented metrics. Evaluations on three static benchmarks further confirm its generalization capability. The code is available at https://github.com/yxy-919/LawThinker-agent .
PDF311February 14, 2026