Un enfoque basado en redes de punteros para la extracción conjunta y detección de intenciones multietiqueta y multiclase.
A Pointer Network-based Approach for Joint Extraction and Detection of Multi-Label Multi-Class Intents
October 29, 2024
Autores: Ankan Mullick, Sombit Bose, Abhilash Nandy, Gajula Sai Chaitanya, Pawan Goyal
cs.AI
Resumen
En los sistemas de diálogo orientados a tareas, la detección de intenciones es crucial para interpretar las consultas de los usuarios y proporcionar respuestas adecuadas. La investigación existente aborda principalmente consultas simples con una sola intención, careciendo de sistemas efectivos para manejar consultas complejas con múltiples intenciones y extraer diferentes segmentos de intención. Además, se observa una notable ausencia de conjuntos de datos multilingües y multi-intención. Este estudio aborda tres tareas críticas: extraer múltiples segmentos de intención de las consultas, detectar múltiples intenciones y desarrollar un conjunto de datos de intención multilingüe y multietiqueta. Presentamos un nuevo conjunto de datos de detección de intenciones multi-etiqueta y multi-clase (conjunto de datos MLMCID) seleccionado de conjuntos de datos de referencia existentes. También proponemos una arquitectura basada en redes de punteros (MLMCID) para extraer segmentos de intención y detectar múltiples intenciones con etiquetas gruesas y detalladas en forma de séxtuples. Un análisis exhaustivo demuestra la superioridad de nuestro sistema basado en redes de punteros sobre enfoques de referencia en términos de precisión y puntuación F1 en varios conjuntos de datos.
English
In task-oriented dialogue systems, intent detection is crucial for
interpreting user queries and providing appropriate responses. Existing
research primarily addresses simple queries with a single intent, lacking
effective systems for handling complex queries with multiple intents and
extracting different intent spans. Additionally, there is a notable absence of
multilingual, multi-intent datasets. This study addresses three critical tasks:
extracting multiple intent spans from queries, detecting multiple intents, and
developing a multi-lingual multi-label intent dataset. We introduce a novel
multi-label multi-class intent detection dataset (MLMCID-dataset) curated from
existing benchmark datasets. We also propose a pointer network-based
architecture (MLMCID) to extract intent spans and detect multiple intents with
coarse and fine-grained labels in the form of sextuplets. Comprehensive
analysis demonstrates the superiority of our pointer network-based system over
baseline approaches in terms of accuracy and F1-score across various datasets.Summary
AI-Generated Summary