ChatPaper.aiChatPaper

LawThinker: Глубоко исследующий правовой агент в динамических средах

LawThinker: A Deep Research Legal Agent in Dynamic Environments

February 12, 2026
Авторы: Xinyu Yang, Chenlong Deng, Tongyu Wen, Binyu Xie, Zhicheng Dou
cs.AI

Аннотация

Правовое рассуждение требует не только корректных результатов, но и процессуально соответственных процедур рассуждения. Однако существующие методы не имеют механизмов проверки промежуточных шагов рассуждения, что позволяет ошибкам (например, ссылкам на неприменимые правовые нормы) незаметно распространяться по цепочке рассуждений. Для решения этой проблемы мы предлагаем LawThinker — автономного агента юридического исследования, применяющего стратегию «Исследование-Проверка-Запоминание» для динамичных судебных сред. Ключевая идея заключается в принудительной проверке как атомарной операции после каждого шага исследования знаний. Модуль DeepVerifier анализирует каждый результат поиска по трём измерениям: точность знаний, релевантность фактов и правовых норм, процессуальное соответствие, а модуль памяти обеспечивает межсессионное повторное использование знаний в долгосрочных задачах. Эксперименты на динамичном бенчмарке J1-EVAL показывают, что LawThinker демонстрирует улучшение на 24% по сравнению с прямым рассуждением и на 11% по сравнению с методами на основе рабочих процессов, с особенно значительным прогрессом в процессно-ориентированных метриках. Оценки на трёх статических бенчмарках дополнительно подтверждают его обобщающую способность. Код доступен по адресу https://github.com/yxy-919/LawThinker-agent.
English
Legal reasoning requires not only correct outcomes but also procedurally compliant reasoning processes. However, existing methods lack mechanisms to verify intermediate reasoning steps, allowing errors such as inapplicable statute citations to propagate undetected through the reasoning chain. To address this, we propose LawThinker, an autonomous legal research agent that adopts an Explore-Verify-Memorize strategy for dynamic judicial environments. The core idea is to enforce verification as an atomic operation after every knowledge exploration step. A DeepVerifier module examines each retrieval result along three dimensions of knowledge accuracy, fact-law relevance, and procedural compliance, with a memory module for cross-round knowledge reuse in long-horizon tasks. Experiments on the dynamic benchmark J1-EVAL show that LawThinker achieves a 24% improvement over direct reasoning and an 11% gain over workflow-based methods, with particularly strong improvements on process-oriented metrics. Evaluations on three static benchmarks further confirm its generalization capability. The code is available at https://github.com/yxy-919/LawThinker-agent .
PDF311February 14, 2026