ChatPaper.aiChatPaper

LawThinker: Un Agente Jurídico de Investigación Profunda en Entornos Dinámicos

LawThinker: A Deep Research Legal Agent in Dynamic Environments

February 12, 2026
Autores: Xinyu Yang, Chenlong Deng, Tongyu Wen, Binyu Xie, Zhicheng Dou
cs.AI

Resumen

El razonamiento jurídico exige no solo resultados correctos, sino también procesos de razonamiento procedimentalmente conformes. Sin embargo, los métodos existentes carecen de mecanismos para verificar los pasos intermedios del razonamiento, lo que permite que errores como citas normativas inaplicables se propaguen sin detectarse a lo largo de la cadena de razonamiento. Para abordar este problema, proponemos LawThinker, un agente autónomo de investigación jurídica que adopta una estrategia de Explorar-Verificar-Memorizar para entornos judiciales dinámicos. La idea central es aplicar la verificación como una operación atómica tras cada paso de exploración de conocimiento. Un módulo DeepVerifier examina cada resultado de recuperación en tres dimensiones: precisión del conocimiento, relevancia hecho-derecho y conformidad procedimental, junto con un módulo de memoria para la reutilización de conocimiento entre rondas en tareas de horizonte prolongado. Los experimentos en el benchmark dinámico J1-EVAL muestran que LawThinker logra una mejora del 24% frente al razonamiento directo y una ganancia del 11% sobre métodos basados en flujos de trabajo, con mejoras particularmente sólidas en métricas orientadas al proceso. Las evaluaciones en tres benchmarks estáticos confirman además su capacidad de generalización. El código está disponible en https://github.com/yxy-919/LawThinker-agent.
English
Legal reasoning requires not only correct outcomes but also procedurally compliant reasoning processes. However, existing methods lack mechanisms to verify intermediate reasoning steps, allowing errors such as inapplicable statute citations to propagate undetected through the reasoning chain. To address this, we propose LawThinker, an autonomous legal research agent that adopts an Explore-Verify-Memorize strategy for dynamic judicial environments. The core idea is to enforce verification as an atomic operation after every knowledge exploration step. A DeepVerifier module examines each retrieval result along three dimensions of knowledge accuracy, fact-law relevance, and procedural compliance, with a memory module for cross-round knowledge reuse in long-horizon tasks. Experiments on the dynamic benchmark J1-EVAL show that LawThinker achieves a 24% improvement over direct reasoning and an 11% gain over workflow-based methods, with particularly strong improvements on process-oriented metrics. Evaluations on three static benchmarks further confirm its generalization capability. The code is available at https://github.com/yxy-919/LawThinker-agent .
PDF311February 14, 2026