ChatPaper.aiChatPaper

ClaimGen-CN: Ein umfangreicher chinesischer Datensatz zur Generierung juristischer Ansprüche

ClaimGen-CN: A Large-scale Chinese Dataset for Legal Claim Generation

August 24, 2025
papers.authors: Siying Zhou, Yiquan Wu, Hui Chen, Xavier Hu, Kun Kuang, Adam Jatowt, Ming Hu, Chunyan Zheng, Fei Wu
cs.AI

papers.abstract

Rechtsansprüche beziehen sich auf die Forderungen des Klägers in einem Fall und sind entscheidend für die Anleitung der richterlichen Argumentation und die Falllösung. Während viele Arbeiten darauf abzielen, die Effizienz von Juristen zu verbessern, bleibt die Forschung zur Unterstützung von Laien (z.B. Klägern) weitgehend unerforscht. Diese Arbeit untersucht das Problem der Generierung von Rechtsansprüchen basierend auf den Fakten eines gegebenen Falls. Zunächst erstellen wir ClaimGen-CN, den ersten Datensatz für die Aufgabe der Generierung von Rechtsansprüchen im chinesischen Recht, aus verschiedenen realen Rechtsstreitigkeiten. Darüber hinaus entwickeln wir ein Bewertungsmaß, das speziell für die Beurteilung der generierten Ansprüche konzipiert ist und zwei wesentliche Dimensionen umfasst: Faktentreue und Klarheit. Aufbauend darauf führen wir eine umfassende Zero-Shot-Evaluierung von state-of-the-art allgemeinen und rechtswissenschaftlichen großen Sprachmodellen durch. Unsere Ergebnisse verdeutlichen die Grenzen der aktuellen Modelle in Bezug auf faktische Präzision und ausdrucksstarke Klarheit und weisen auf die Notwendigkeit einer gezielteren Entwicklung in diesem Bereich hin. Um die weitere Erforschung dieser wichtigen Aufgabe zu fördern, werden wir den Datensatz öffentlich zugänglich machen.
English
Legal claims refer to the plaintiff's demands in a case and are essential to guiding judicial reasoning and case resolution. While many works have focused on improving the efficiency of legal professionals, the research on helping non-professionals (e.g., plaintiffs) remains unexplored. This paper explores the problem of legal claim generation based on the given case's facts. First, we construct ClaimGen-CN, the first dataset for Chinese legal claim generation task, from various real-world legal disputes. Additionally, we design an evaluation metric tailored for assessing the generated claims, which encompasses two essential dimensions: factuality and clarity. Building on this, we conduct a comprehensive zero-shot evaluation of state-of-the-art general and legal-domain large language models. Our findings highlight the limitations of the current models in factual precision and expressive clarity, pointing to the need for more targeted development in this domain. To encourage further exploration of this important task, we will make the dataset publicly available.
PDF02August 27, 2025