ChatPaper.aiChatPaper

GLiNER2: Un sistema eficiente de extracción de información multitarea con interfaz basada en esquemas

GLiNER2: An Efficient Multi-Task Information Extraction System with Schema-Driven Interface

July 24, 2025
Autores: Urchade Zaratiana, Gil Pasternak, Oliver Boyd, George Hurn-Maloney, Ash Lewis
cs.AI

Resumen

La extracción de información (IE) es fundamental para numerosas aplicaciones de PLN, sin embargo, las soluciones existentes a menudo requieren modelos especializados para diferentes tareas o dependen de modelos de lenguaje grandes computacionalmente costosos. Presentamos GLiNER2, un marco unificado que mejora la arquitectura original de GLiNER para admitir el reconocimiento de entidades nombradas, la clasificación de texto y la extracción de datos estructurados jerárquicos dentro de un único modelo eficiente. Construido sobre una arquitectura de codificador de transformadores preentrenados, GLiNER2 mantiene la eficiencia en CPU y un tamaño compacto, al tiempo que introduce la composición multitarea a través de una interfaz intuitiva basada en esquemas. Nuestros experimentos demuestran un rendimiento competitivo en tareas de extracción y clasificación, con mejoras sustanciales en la accesibilidad de implementación en comparación con alternativas basadas en LLM. Publicamos GLiNER2 como una biblioteca de código abierto instalable mediante pip, con modelos preentrenados y documentación en https://github.com/fastino-ai/GLiNER2.
English
Information extraction (IE) is fundamental to numerous NLP applications, yet existing solutions often require specialized models for different tasks or rely on computationally expensive large language models. We present GLiNER2, a unified framework that enhances the original GLiNER architecture to support named entity recognition, text classification, and hierarchical structured data extraction within a single efficient model. Built pretrained transformer encoder architecture, GLiNER2 maintains CPU efficiency and compact size while introducing multi-task composition through an intuitive schema-based interface. Our experiments demonstrate competitive performance across extraction and classification tasks with substantial improvements in deployment accessibility compared to LLM-based alternatives. We release GLiNER2 as an open-source pip-installable library with pre-trained models and documentation at https://github.com/fastino-ai/GLiNER2.
PDF133July 25, 2025