ClaimGen-CN: Un Dataset su larga scala in cinese per la generazione di rivendicazioni legali
ClaimGen-CN: A Large-scale Chinese Dataset for Legal Claim Generation
August 24, 2025
Autori: Siying Zhou, Yiquan Wu, Hui Chen, Xavier Hu, Kun Kuang, Adam Jatowt, Ming Hu, Chunyan Zheng, Fei Wu
cs.AI
Abstract
Le rivendicazioni legali si riferiscono alle richeste del querelante in un caso e sono essenziali per guidare il ragionamento giudiziario e la risoluzione del caso. Mentre molti lavori si sono concentrati sul miglioramento dell'efficienza dei professionisti del diritto, la ricerca sull'aiuto ai non professionisti (ad esempio, i querelanti) rimane inesplorata. Questo articolo esplora il problema della generazione di rivendicazioni legali basate sui fatti del caso. In primo luogo, costruiamo ClaimGen-CN, il primo dataset per il compito di generazione di rivendicazioni legali in cinese, derivato da varie controversie legali del mondo reale. Inoltre, progettiamo una metrica di valutazione specifica per valutare le rivendicazioni generate, che comprende due dimensioni essenziali: la fattualità e la chiarezza. Sulla base di ciò, conduciamo una valutazione zero-shot completa dei modelli linguistici di grandi dimensioni generali e specifici per il dominio legale. I nostri risultati evidenziano i limiti dei modelli attuali nella precisione fattuale e nella chiarezza espressiva, indicando la necessità di uno sviluppo più mirato in questo ambito. Per incoraggiare ulteriori esplorazioni di questo importante compito, renderemo il dataset disponibile pubblicamente.
English
Legal claims refer to the plaintiff's demands in a case and are essential to
guiding judicial reasoning and case resolution. While many works have focused
on improving the efficiency of legal professionals, the research on helping
non-professionals (e.g., plaintiffs) remains unexplored. This paper explores
the problem of legal claim generation based on the given case's facts. First,
we construct ClaimGen-CN, the first dataset for Chinese legal claim generation
task, from various real-world legal disputes. Additionally, we design an
evaluation metric tailored for assessing the generated claims, which
encompasses two essential dimensions: factuality and clarity. Building on this,
we conduct a comprehensive zero-shot evaluation of state-of-the-art general and
legal-domain large language models. Our findings highlight the limitations of
the current models in factual precision and expressive clarity, pointing to the
need for more targeted development in this domain. To encourage further
exploration of this important task, we will make the dataset publicly
available.