ChatPaper.aiChatPaper

GLiNER-Relex: 固有表現認識と関係抽出を統合した統一フレームワーク

GLiNER-Relex: A Unified Framework for Joint Named Entity Recognition and Relation Extraction

May 11, 2026
著者: Ihor Stepanov, Oleksandr Lukashov, Mykhailo Shtopko, Vivek Kalyanarangan
cs.AI

要旨

結合型固有表現認識(NER)と関係抽出(RE)は、非構造化テキストから知識グラフを構築するための自然言語処理における基本タスクである。近年のアプローチではNERとREをそれぞれ個別のモデルを必要とする別々のタスクとして扱っているが、本稿ではGLiNERフレームワークを拡張し、単一モデルで固有表現認識と関係抽出の両方を実行する統合アーキテクチャであるGLiNER-Relexを提案する。本手法では、共有の双方向トランスフォーマーエンコーダーを活用してテキスト、固有表現タイプラベル、関係タイプラベルを共同で表現し、推論時に指定された任意の固有表現タイプと関係タイプのゼロショット抽出を可能にする。GLiNER-Relexは認識されたスパンから固有表現ペア表現を構築し、専用の関係スコアリングモジュールを用いて関係タイプ埋め込みと照合してスコアリングする。本モデルをCoNLL04、DocRED、FewRel、CrossREの4つの標準的な関係抽出ベンチマークで評価し、専門的な関係抽出モデルおよび大規模言語モデルの両方に対して競争力のある性能を示すと同時に、GLiNERファミリーに特徴的な計算効率を維持している。本モデルは、推論時にユーザーが任意の固有表現タイプと関係タイプラベルを指定し、単一の呼び出しで固有表現と関係トリプレットの両方を取得できる簡易な推論APIを備えたオープンソースのPythonパッケージとして公開されている。全てのモデルとコードは公開されている。
English
Joint named entity recognition (NER) and relation extraction (RE) is a fundamental task in natural language processing for constructing knowledge graphs from unstructured text. While recent approaches treat NER and RE as separate tasks requiring distinct models, we introduce GLiNER-Relex, a unified architecture that extends the GLiNER framework to perform both entity recognition and relation extraction in a single model. Our approach leverages a shared bidirectional transformer encoder to jointly represent text, entity type labels, and relation type labels, enabling zero-shot extraction of arbitrary entity and relation types specified at inference time. GLiNER-Relex constructs entity pair representations from recognized spans and scores them against relation type embeddings using a dedicated relation scoring module. We evaluate our model on four standard relation extraction benchmarks: CoNLL04, DocRED, FewRel, and CrossRE, and demonstrate competitive performance against both specialized relation extraction models and large language models, while maintaining the computational efficiency characteristic of the GLiNER family. The model is released as an open-source Python package with a simple inference API that allows users to specify arbitrary entity and relation type labels at inference time and obtain both entities and relation triplets in a single call. All models and code are publicly available.
PDF11May 14, 2026