ClaimGen-CN: Un conjunto de datos a gran escala en chino para la generación de reclamaciones legales
ClaimGen-CN: A Large-scale Chinese Dataset for Legal Claim Generation
August 24, 2025
Autores: Siying Zhou, Yiquan Wu, Hui Chen, Xavier Hu, Kun Kuang, Adam Jatowt, Ming Hu, Chunyan Zheng, Fei Wu
cs.AI
Resumen
Las demandas legales se refieren a las solicitudes del demandante en un caso y son esenciales para guiar el razonamiento judicial y la resolución del caso. Si bien muchos trabajos se han centrado en mejorar la eficiencia de los profesionales del derecho, la investigación sobre cómo ayudar a los no profesionales (por ejemplo, los demandantes) sigue siendo inexplorada. Este artículo explora el problema de la generación de demandas legales basadas en los hechos de un caso dado. En primer lugar, construimos ClaimGen-CN, el primer conjunto de datos para la tarea de generación de demandas legales en chino, a partir de diversas disputas legales del mundo real. Además, diseñamos una métrica de evaluación específica para evaluar las demandas generadas, que abarca dos dimensiones esenciales: factualidad y claridad. Sobre esta base, realizamos una evaluación integral de modelos de lenguaje generales y específicos del ámbito legal de última generación en un escenario de zero-shot. Nuestros hallazgos destacan las limitaciones de los modelos actuales en precisión factual y claridad expresiva, señalando la necesidad de un desarrollo más específico en este dominio. Para fomentar una mayor exploración de esta importante tarea, pondremos el conjunto de datos a disposición del público.
English
Legal claims refer to the plaintiff's demands in a case and are essential to
guiding judicial reasoning and case resolution. While many works have focused
on improving the efficiency of legal professionals, the research on helping
non-professionals (e.g., plaintiffs) remains unexplored. This paper explores
the problem of legal claim generation based on the given case's facts. First,
we construct ClaimGen-CN, the first dataset for Chinese legal claim generation
task, from various real-world legal disputes. Additionally, we design an
evaluation metric tailored for assessing the generated claims, which
encompasses two essential dimensions: factuality and clarity. Building on this,
we conduct a comprehensive zero-shot evaluation of state-of-the-art general and
legal-domain large language models. Our findings highlight the limitations of
the current models in factual precision and expressive clarity, pointing to the
need for more targeted development in this domain. To encourage further
exploration of this important task, we will make the dataset publicly
available.