Vinculación de Sentido de Palabras: Desambiguación Fuera del Entorno Controlado
Word Sense Linking: Disambiguating Outside the Sandbox
December 12, 2024
Autores: Andrei Stefan Bejgu, Edoardo Barba, Luigi Procopio, Alberte Fernández-Castro, Roberto Navigli
cs.AI
Resumen
La Desambiguación del Sentido de las Palabras (WSD, por sus siglas en inglés) es la tarea de asociar una palabra en un contexto dado con su significado más adecuado entre un conjunto de posibles candidatos. Aunque la tarea ha experimentado un renovado interés recientemente, con sistemas que logran un rendimiento por encima del acuerdo interanotador estimado, en el momento de escribir esto aún lucha por encontrar aplicaciones prácticas. Sostenemos que una de las razones detrás de esto es la dificultad de aplicar WSD al texto plano. De hecho, en la formulación estándar, los modelos trabajan bajo la suposición de que a) todos los fragmentos a desambiguar ya han sido identificados, y b) se proporcionan todos los posibles sentidos candidatos de cada fragmento, ambos requisitos que están lejos de ser triviales. En este trabajo, presentamos una nueva tarea llamada Vinculación del Sentido de las Palabras (WSL, por sus siglas en inglés) donde, dada un texto de entrada y un inventario de sentidos de referencia, los sistemas deben tanto identificar qué fragmentos desambiguar como luego vincularlos con su significado más adecuado. Proponemos una arquitectura basada en transformadores para la tarea y evaluamos exhaustivamente tanto su rendimiento como el de los sistemas de WSD de última generación adaptados a WSL, relajando iterativamente las suposiciones de WSD. Esperamos que nuestro trabajo fomente una integración más sencilla de la semántica léxica en aplicaciones prácticas.
English
Word Sense Disambiguation (WSD) is the task of associating a word in a given
context with its most suitable meaning among a set of possible candidates.
While the task has recently witnessed renewed interest, with systems achieving
performances above the estimated inter-annotator agreement, at the time of
writing it still struggles to find downstream applications. We argue that one
of the reasons behind this is the difficulty of applying WSD to plain text.
Indeed, in the standard formulation, models work under the assumptions that a)
all the spans to disambiguate have already been identified, and b) all the
possible candidate senses of each span are provided, both of which are
requirements that are far from trivial. In this work, we present a new task
called Word Sense Linking (WSL) where, given an input text and a reference
sense inventory, systems have to both identify which spans to disambiguate and
then link them to their most suitable meaning.We put forward a
transformer-based architecture for the task and thoroughly evaluate both its
performance and those of state-of-the-art WSD systems scaled to WSL,
iteratively relaxing the assumptions of WSD. We hope that our work will foster
easier integration of lexical semantics into downstream applications.Summary
AI-Generated Summary