ChatPaper.aiChatPaper

ScheMatiQ: Von der Forschungsfrage zu strukturierten Daten durch interaktive Schema-Entdeckung

ScheMatiQ: From Research Question to Structured Data through Interactive Schema Discovery

April 10, 2026
Autoren: Shahar Levy, Eliya Habba, Reshef Mintz, Barak Raveh, Renana Keydar, Gabriel Stanovsky
cs.AI

Zusammenfassung

Viele Disziplinen stellen natursprachliche Forschungsfragen zu großen Dokumentensammlungen, deren Beantwortung typischerweise strukturierte Evidenz erfordert. Diese wurde traditionell durch manuelles Design eines Annotationsschemas und exhaustive manuelle Annotation des Korpus gewonnen – ein langsamer und fehleranfälliger Prozess. Wir stellen ScheMatiQ vor, das Aufrufe eines zugrundeliegenden Large Language Models (LLM) nutzt, um aus einer Frage und einem Korpus ein Schema und eine fundierte Datenbank zu generieren. Eine Web-Oberfläche ermöglicht es, die Extraktion zu steuern und zu überarbeiten. In Zusammenarbeit mit Domänenexperten zeigen wir, dass ScheMatiQ Ergebnisse liefert, die realweltliche Analysen in den Bereichen Recht und computerbasierte Biologie unterstützen. Wir veröffentlichen ScheMatiQ als Open Source mit einer öffentlichen Web-Oberfläche und laden Experten aller Disziplinen ein, es mit ihren eigenen Daten zu nutzen. Alle Ressourcen, inklusive der Website, des Quellcodes und des Demo-Videos, sind verfügbar unter: www.ScheMatiQ-ai.com
English
Many disciplines pose natural-language research questions over large document collections whose answers typically require structured evidence, traditionally obtained by manually designing an annotation schema and exhaustively labeling the corpus, a slow and error-prone process. We introduce ScheMatiQ, which leverages calls to a backbone LLM to take a question and a corpus to produce a schema and a grounded database, with a web interface that lets steer and revise the extraction. In collaboration with domain experts, we show that ScheMatiQ yields outputs that support real-world analysis in law and computational biology. We release ScheMatiQ as open source with a public web interface, and invite experts across disciplines to use it with their own data. All resources, including the website, source code, and demonstration video, are available at: www.ScheMatiQ-ai.com
PDF53April 14, 2026