ScheMatiQ: Dal Question di Ricerca ai Dati Strutturati attraverso la Scoperta Interattiva degli Schemi
ScheMatiQ: From Research Question to Structured Data through Interactive Schema Discovery
April 10, 2026
Autori: Shahar Levy, Eliya Habba, Reshef Mintz, Barak Raveh, Renana Keydar, Gabriel Stanovsky
cs.AI
Abstract
Molte discipline pongono domande di ricerca in linguaggio naturale su ampie collezioni documentali, le cui risposte richiedono tipicamente evidenze strutturate, tradizionalmente ottenute progettando manualmente uno schema di annotazione ed etichettando esaustivamente il corpus, un processo lento e soggetto a errori. Introduciamo ScheMatiQ, che sfrutta chiamate a un LLM di base per prendere una domanda e un corpus e produrre uno schema e un database fondato, con un'interfaccia web che consente di guidare e revisionare l'estrazione. In collaborazione con esperti di dominio, dimostriamo che ScheMatiQ produce output che supportano analisi del mondo reale in ambito giuridico e di biologia computazionale. Rilasciamo ScheMatiQ come open source con un'interfaccia web pubblica e invitiamo esperti di varie discipline a utilizzarlo con i propri dati. Tutte le risorse, incluso il sito web, il codice sorgente e il video dimostrativo, sono disponibili su: www.ScheMatiQ-ai.com
English
Many disciplines pose natural-language research questions over large document collections whose answers typically require structured evidence, traditionally obtained by manually designing an annotation schema and exhaustively labeling the corpus, a slow and error-prone process. We introduce ScheMatiQ, which leverages calls to a backbone LLM to take a question and a corpus to produce a schema and a grounded database, with a web interface that lets steer and revise the extraction. In collaboration with domain experts, we show that ScheMatiQ yields outputs that support real-world analysis in law and computational biology. We release ScheMatiQ as open source with a public web interface, and invite experts across disciplines to use it with their own data. All resources, including the website, source code, and demonstration video, are available at: www.ScheMatiQ-ai.com