Uma Abordagem Baseada em Rede de Ponteiros para Extração e Detecção Conjunta de Intenções Multirrótulo Multiclasse
A Pointer Network-based Approach for Joint Extraction and Detection of Multi-Label Multi-Class Intents
October 29, 2024
Autores: Ankan Mullick, Sombit Bose, Abhilash Nandy, Gajula Sai Chaitanya, Pawan Goyal
cs.AI
Resumo
Nos sistemas de diálogo orientados à tarefa, a detecção de intenções é crucial para interpretar as consultas dos usuários e fornecer respostas apropriadas. As pesquisas existentes abordam principalmente consultas simples com uma única intenção, carecendo de sistemas eficazes para lidar com consultas complexas com múltiplas intenções e extrair diferentes segmentos de intenção. Além disso, há uma ausência notável de conjuntos de dados multilíngues e multi-intenções. Este estudo aborda três tarefas críticas: extrair múltiplos segmentos de intenção das consultas, detectar múltiplas intenções e desenvolver um conjunto de dados de intenção multilíngue e multi-rótulo. Apresentamos um novo conjunto de dados de detecção de intenção multi-rótulo e multi-classe (conjunto de dados MLMCID) elaborado a partir de conjuntos de dados de referência existentes. Também propomos uma arquitetura baseada em rede de ponteiros (MLMCID) para extrair segmentos de intenção e detectar múltiplas intenções com rótulos grosseiros e refinados na forma de sêxtuplos. Uma análise abrangente demonstra a superioridade do nosso sistema baseado em rede de ponteiros em relação às abordagens de referência em termos de precisão e pontuação F1 em vários conjuntos de dados.
English
In task-oriented dialogue systems, intent detection is crucial for
interpreting user queries and providing appropriate responses. Existing
research primarily addresses simple queries with a single intent, lacking
effective systems for handling complex queries with multiple intents and
extracting different intent spans. Additionally, there is a notable absence of
multilingual, multi-intent datasets. This study addresses three critical tasks:
extracting multiple intent spans from queries, detecting multiple intents, and
developing a multi-lingual multi-label intent dataset. We introduce a novel
multi-label multi-class intent detection dataset (MLMCID-dataset) curated from
existing benchmark datasets. We also propose a pointer network-based
architecture (MLMCID) to extract intent spans and detect multiple intents with
coarse and fine-grained labels in the form of sextuplets. Comprehensive
analysis demonstrates the superiority of our pointer network-based system over
baseline approaches in terms of accuracy and F1-score across various datasets.Summary
AI-Generated Summary