ChatPaper.aiChatPaper

GLiNER2: Een efficiënt multi-task informatie-extractiesysteem met een schema-gestuurde interface

GLiNER2: An Efficient Multi-Task Information Extraction System with Schema-Driven Interface

July 24, 2025
Auteurs: Urchade Zaratiana, Gil Pasternak, Oliver Boyd, George Hurn-Maloney, Ash Lewis
cs.AI

Samenvatting

Informatie-extractie (IE) is fundamenteel voor talrijke NLP-toepassingen, maar bestaande oplossingen vereisen vaak gespecialiseerde modellen voor verschillende taken of zijn afhankelijk van rekenintensieve grote taalmodelen. Wij presenteren GLiNER2, een uniform raamwerk dat de oorspronkelijke GLiNER-architectuur verbetert om named entity recognition, tekstclassificatie en hiërarchische gestructureerde data-extractie te ondersteunen binnen één efficiënt model. Gebouwd op een vooraf getrainde transformer-encoderarchitectuur, behoudt GLiNER2 CPU-efficiëntie en een compacte omvang, terwijl het multitask-compositie introduceert via een intuïtieve schema-gebaseerde interface. Onze experimenten tonen competitieve prestaties aan bij extractie- en classificatietaken, met aanzienlijke verbeteringen in implementatietoegankelijkheid vergeleken met LLM-gebaseerde alternatieven. Wij brengen GLiNER2 uit als een open-source pip-installeerbare bibliotheek met vooraf getrainde modellen en documentatie op https://github.com/fastino-ai/GLiNER2.
English
Information extraction (IE) is fundamental to numerous NLP applications, yet existing solutions often require specialized models for different tasks or rely on computationally expensive large language models. We present GLiNER2, a unified framework that enhances the original GLiNER architecture to support named entity recognition, text classification, and hierarchical structured data extraction within a single efficient model. Built pretrained transformer encoder architecture, GLiNER2 maintains CPU efficiency and compact size while introducing multi-task composition through an intuitive schema-based interface. Our experiments demonstrate competitive performance across extraction and classification tasks with substantial improvements in deployment accessibility compared to LLM-based alternatives. We release GLiNER2 as an open-source pip-installable library with pre-trained models and documentation at https://github.com/fastino-ai/GLiNER2.
PDF2411July 25, 2025