ChatPaper.aiChatPaper

GLiNER2: Un Sistema Efficiente per l'Estrazione di Informazioni Multi-Task con Interfaccia Guidata da Schema

GLiNER2: An Efficient Multi-Task Information Extraction System with Schema-Driven Interface

July 24, 2025
Autori: Urchade Zaratiana, Gil Pasternak, Oliver Boyd, George Hurn-Maloney, Ash Lewis
cs.AI

Abstract

L'estrazione di informazioni (IE) è fondamentale per numerose applicazioni di NLP, tuttavia le soluzioni esistenti spesso richiedono modelli specializzati per diversi compiti o si basano su modelli linguistici di grandi dimensioni computazionalmente costosi. Presentiamo GLiNER2, un framework unificato che migliora l'architettura originale di GLiNER per supportare il riconoscimento di entità nominate, la classificazione del testo e l'estrazione di dati strutturati gerarchici all'interno di un singolo modello efficiente. Basato su un'architettura di codificatore transformer pre-addestrato, GLiNER2 mantiene l'efficienza su CPU e dimensioni compatte, introducendo al contempo una composizione multi-task attraverso un'interfaccia intuitiva basata su schema. I nostri esperimenti dimostrano prestazioni competitive in compiti di estrazione e classificazione, con sostanziali miglioramenti nell'accessibilità di distribuzione rispetto alle alternative basate su LLM. Rilasciamo GLiNER2 come libreria open-source installabile via pip, con modelli pre-addestrati e documentazione disponibile all'indirizzo https://github.com/fastino-ai/GLiNER2.
English
Information extraction (IE) is fundamental to numerous NLP applications, yet existing solutions often require specialized models for different tasks or rely on computationally expensive large language models. We present GLiNER2, a unified framework that enhances the original GLiNER architecture to support named entity recognition, text classification, and hierarchical structured data extraction within a single efficient model. Built pretrained transformer encoder architecture, GLiNER2 maintains CPU efficiency and compact size while introducing multi-task composition through an intuitive schema-based interface. Our experiments demonstrate competitive performance across extraction and classification tasks with substantial improvements in deployment accessibility compared to LLM-based alternatives. We release GLiNER2 as an open-source pip-installable library with pre-trained models and documentation at https://github.com/fastino-ai/GLiNER2.
PDF144July 25, 2025