ScheMatiQ: Da Pergunta de Pesquisa aos Dados Estruturados através da Descoberta Interativa de Esquemas
ScheMatiQ: From Research Question to Structured Data through Interactive Schema Discovery
April 10, 2026
Autores: Shahar Levy, Eliya Habba, Reshef Mintz, Barak Raveh, Renana Keydar, Gabriel Stanovsky
cs.AI
Resumo
Muitas disciplinas apresentam questões de pesquisa em linguagem natural sobre grandes coleções de documentos, cujas respostas normalmente exigem evidências estruturadas, tradicionalmente obtidas através do desenho manual de um esquema de anotação e da rotulagem exaustiva do corpus, um processo lento e propenso a erros. Apresentamos o ScheMatiQ, que aproveita chamadas para um LLM de base para receber uma pergunta e um corpus e produzir um esquema e uma base de dados fundamentada, com uma interface web que permite orientar e revisar a extração. Em colaboração com especialistas de domínio, mostramos que o ScheMatiQ produz resultados que suportam análises do mundo real no direito e na biologia computacional. Disponibilizamos o ScheMatiQ como código aberto com uma interface web pública e convidamos especialistas de várias disciplinas a utilizá-lo com os seus próprios dados. Todos os recursos, incluindo o website, código fonte e vídeo de demonstração, estão disponíveis em: www.ScheMatiQ-ai.com.
English
Many disciplines pose natural-language research questions over large document collections whose answers typically require structured evidence, traditionally obtained by manually designing an annotation schema and exhaustively labeling the corpus, a slow and error-prone process. We introduce ScheMatiQ, which leverages calls to a backbone LLM to take a question and a corpus to produce a schema and a grounded database, with a web interface that lets steer and revise the extraction. In collaboration with domain experts, we show that ScheMatiQ yields outputs that support real-world analysis in law and computational biology. We release ScheMatiQ as open source with a public web interface, and invite experts across disciplines to use it with their own data. All resources, including the website, source code, and demonstration video, are available at: www.ScheMatiQ-ai.com