Liaison de sens des mots : désambiguïsation en dehors du bac à sable
Word Sense Linking: Disambiguating Outside the Sandbox
December 12, 2024
Auteurs: Andrei Stefan Bejgu, Edoardo Barba, Luigi Procopio, Alberte Fernández-Castro, Roberto Navigli
cs.AI
Résumé
La désambiguïsation de sens des mots (WSD) est la tâche qui consiste à associer un mot dans un contexte donné à sa signification la plus appropriée parmi un ensemble de candidats possibles. Alors que cette tâche a récemment suscité un regain d'intérêt, avec des systèmes atteignant des performances supérieures à l'accord inter-annotateurs estimé, au moment de la rédaction, elle peine encore à trouver des applications concrètes. Nous soutenons qu'une des raisons derrière cela est la difficulté d'appliquer le WSD au texte brut. En effet, dans la formulation standard, les modèles travaillent en supposant que a) tous les segments à désambiguïser ont déjà été identifiés, et b) toutes les significations candidates possibles de chaque segment sont fournies, deux exigences qui sont loin d'être triviales. Dans ce travail, nous présentons une nouvelle tâche appelée Liaison de Sens des Mots (WSL) où, étant donné un texte en entrée et un inventaire de sens de référence, les systèmes doivent à la fois identifier quels segments désambiguïser et ensuite les relier à leur signification la plus appropriée. Nous proposons une architecture basée sur les transformers pour cette tâche et évaluons en détail à la fois ses performances et celles des systèmes WSD de pointe adaptés au WSL, en assouplissant de manière itérative les hypothèses du WSD. Nous espérons que notre travail favorisera une intégration plus facile de la sémantique lexicale dans les applications concrètes.
English
Word Sense Disambiguation (WSD) is the task of associating a word in a given
context with its most suitable meaning among a set of possible candidates.
While the task has recently witnessed renewed interest, with systems achieving
performances above the estimated inter-annotator agreement, at the time of
writing it still struggles to find downstream applications. We argue that one
of the reasons behind this is the difficulty of applying WSD to plain text.
Indeed, in the standard formulation, models work under the assumptions that a)
all the spans to disambiguate have already been identified, and b) all the
possible candidate senses of each span are provided, both of which are
requirements that are far from trivial. In this work, we present a new task
called Word Sense Linking (WSL) where, given an input text and a reference
sense inventory, systems have to both identify which spans to disambiguate and
then link them to their most suitable meaning.We put forward a
transformer-based architecture for the task and thoroughly evaluate both its
performance and those of state-of-the-art WSD systems scaled to WSL,
iteratively relaxing the assumptions of WSD. We hope that our work will foster
easier integration of lexical semantics into downstream applications.Summary
AI-Generated Summary