Подход на основе сети указателей для совместного извлечения и обнаружения мультиклассовых намерений с мультиязычными метками.
A Pointer Network-based Approach for Joint Extraction and Detection of Multi-Label Multi-Class Intents
October 29, 2024
Авторы: Ankan Mullick, Sombit Bose, Abhilash Nandy, Gajula Sai Chaitanya, Pawan Goyal
cs.AI
Аннотация
В задачевых диалоговых системах обнаружение намерений играет ключевую роль в интерпретации запросов пользователей и предоставлении соответствующих ответов. Существующие исследования в основном затрагивают простые запросы с одним намерением, не обеспечивая эффективных систем для обработки сложных запросов с несколькими намерениями и извлечения различных интервалов намерений. Кроме того, отмечается значительное отсутствие мультиязычных, мульти-намеренческих наборов данных. В данном исследовании рассматриваются три критических задачи: извлечение нескольких интервалов намерений из запросов, обнаружение нескольких намерений и разработка мультиязычного мульти-меткированного набора данных намерений. Мы представляем новый набор данных для обнаружения множественных меток намерений (MLMCID-dataset), собранный из существующих эталонных наборов данных. Мы также предлагаем архитектуру на основе сети указателей (MLMCID) для извлечения интервалов намерений и обнаружения нескольких намерений с грубыми и мелкозернистыми метками в виде шестерок. Комплексный анализ демонстрирует превосходство нашей системы на основе сети указателей над базовыми подходами в терминах точности и F1-меры на различных наборах данных.
English
In task-oriented dialogue systems, intent detection is crucial for
interpreting user queries and providing appropriate responses. Existing
research primarily addresses simple queries with a single intent, lacking
effective systems for handling complex queries with multiple intents and
extracting different intent spans. Additionally, there is a notable absence of
multilingual, multi-intent datasets. This study addresses three critical tasks:
extracting multiple intent spans from queries, detecting multiple intents, and
developing a multi-lingual multi-label intent dataset. We introduce a novel
multi-label multi-class intent detection dataset (MLMCID-dataset) curated from
existing benchmark datasets. We also propose a pointer network-based
architecture (MLMCID) to extract intent spans and detect multiple intents with
coarse and fine-grained labels in the form of sextuplets. Comprehensive
analysis demonstrates the superiority of our pointer network-based system over
baseline approaches in terms of accuracy and F1-score across various datasets.Summary
AI-Generated Summary