ChatPaper.aiChatPaper

GLiNER2: Ein effizientes Multi-Task-Informationsextraktionssystem mit schema-gesteuerter Schnittstelle

GLiNER2: An Efficient Multi-Task Information Extraction System with Schema-Driven Interface

July 24, 2025
papers.authors: Urchade Zaratiana, Gil Pasternak, Oliver Boyd, George Hurn-Maloney, Ash Lewis
cs.AI

papers.abstract

Die Informationsextraktion (IE) ist grundlegend für zahlreiche NLP-Anwendungen, doch bestehende Lösungen erfordern oft spezialisierte Modelle für verschiedene Aufgaben oder setzen auf rechenintensive große Sprachmodelle. Wir präsentieren GLiNER2, ein einheitliches Framework, das die ursprüngliche GLiNER-Architektur erweitert, um die Erkennung benannter Entitäten, Textklassifizierung und die Extraktion hierarchisch strukturierter Daten innerhalb eines einzigen effizienten Modells zu unterstützen. Basierend auf einer vortrainierten Transformer-Encoder-Architektur behält GLiNER2 CPU-Effizienz und kompakte Größe bei und führt gleichzeitig eine Multitask-Komposition durch eine intuitive schema-basierte Schnittstelle ein. Unsere Experimente zeigen eine wettbewerbsfähige Leistung bei Extraktions- und Klassifizierungsaufgaben mit erheblichen Verbesserungen in der Zugänglichkeit der Bereitstellung im Vergleich zu LLM-basierten Alternativen. Wir veröffentlichen GLiNER2 als eine Open-Source-Bibliothek, die über pip installierbar ist, und stellen vortrainierte Modelle sowie Dokumentation unter https://github.com/fastino-ai/GLiNER2 bereit.
English
Information extraction (IE) is fundamental to numerous NLP applications, yet existing solutions often require specialized models for different tasks or rely on computationally expensive large language models. We present GLiNER2, a unified framework that enhances the original GLiNER architecture to support named entity recognition, text classification, and hierarchical structured data extraction within a single efficient model. Built pretrained transformer encoder architecture, GLiNER2 maintains CPU efficiency and compact size while introducing multi-task composition through an intuitive schema-based interface. Our experiments demonstrate competitive performance across extraction and classification tasks with substantial improvements in deployment accessibility compared to LLM-based alternatives. We release GLiNER2 as an open-source pip-installable library with pre-trained models and documentation at https://github.com/fastino-ai/GLiNER2.
PDF133July 25, 2025