ChatPaper.aiChatPaper

GLiNER2 : Un système efficace d'extraction d'informations multi-tâches avec une interface pilotée par schéma

GLiNER2: An Efficient Multi-Task Information Extraction System with Schema-Driven Interface

July 24, 2025
papers.authors: Urchade Zaratiana, Gil Pasternak, Oliver Boyd, George Hurn-Maloney, Ash Lewis
cs.AI

papers.abstract

L'extraction d'information (IE) est fondamentale pour de nombreuses applications de traitement du langage naturel (NLP), mais les solutions existantes nécessitent souvent des modèles spécialisés pour différentes tâches ou reposent sur des modèles de langage de grande taille, coûteux en calcul. Nous présentons GLiNER2, un cadre unifié qui améliore l'architecture originale de GLiNER pour prendre en charge la reconnaissance d'entités nommées, la classification de texte et l'extraction de données structurées hiérarchiques au sein d'un seul modèle efficace. Basé sur une architecture de transformateur pré-entraîné, GLiNER2 maintient une efficacité sur CPU et une taille compacte tout en introduisant une composition multi-tâches via une interface intuitive basée sur des schémas. Nos expériences démontrent des performances compétitives dans les tâches d'extraction et de classification, avec des améliorations substantielles en termes d'accessibilité de déploiement par rapport aux alternatives basées sur des modèles de langage de grande taille. Nous publions GLiNER2 en tant que bibliothèque open-source installable via pip, avec des modèles pré-entraînés et une documentation disponible à l'adresse https://github.com/fastino-ai/GLiNER2.
English
Information extraction (IE) is fundamental to numerous NLP applications, yet existing solutions often require specialized models for different tasks or rely on computationally expensive large language models. We present GLiNER2, a unified framework that enhances the original GLiNER architecture to support named entity recognition, text classification, and hierarchical structured data extraction within a single efficient model. Built pretrained transformer encoder architecture, GLiNER2 maintains CPU efficiency and compact size while introducing multi-task composition through an intuitive schema-based interface. Our experiments demonstrate competitive performance across extraction and classification tasks with substantial improvements in deployment accessibility compared to LLM-based alternatives. We release GLiNER2 as an open-source pip-installable library with pre-trained models and documentation at https://github.com/fastino-ai/GLiNER2.
PDF133July 25, 2025