Typed-RAG: Decomposição Multi-Aspecto com Consciência de Tipos para Respostas a Perguntas Não-Factuais
Typed-RAG: Type-aware Multi-Aspect Decomposition for Non-Factoid Question Answering
March 20, 2025
Autores: DongGeon Lee, Ahjeong Park, Hyeri Lee, Hyeonseo Nam, Yunho Maeng
cs.AI
Resumo
A resposta a perguntas não factuais (NFQA, do inglês Non-factoid Question-Answering) representa um desafio significativo devido à sua natureza aberta, intenções diversas e à necessidade de raciocínio multiaspectual, o que torna inadequadas as abordagens convencionais de QA factuais, incluindo a geração aumentada por recuperação (RAG, do inglês Retrieval-Augmented Generation). Diferentemente das perguntas factuais, as perguntas não factuais (NFQs, do inglês Non-factoid Questions) não possuem respostas definitivas e exigem a síntese de informações de múltiplas fontes em diversas dimensões de raciocínio. Para superar essas limitações, introduzimos o Typed-RAG, um framework de decomposição multiaspectual com consciência de tipos dentro do paradigma RAG para NFQA. O Typed-RAG classifica as NFQs em tipos distintos — como debate, experiência e comparação — e aplica a decomposição baseada em aspectos para refinar as estratégias de recuperação e geração. Ao decompor NFQs multiaspectuais em subconsultas de aspecto único e agregar os resultados, o Typed-RAG gera respostas mais informativas e contextualmente relevantes. Para avaliar o Typed-RAG, introduzimos o Wiki-NFQA, um conjunto de dados de referência que abrange diversos tipos de NFQs. Os resultados experimentais demonstram que o Typed-RAG supera as abordagens baselines, destacando a importância da decomposição com consciência de tipos para uma recuperação e geração eficazes em NFQA. Nosso código e conjunto de dados estão disponíveis em https://github.com/TeamNLP/Typed-RAG{https://github.com/TeamNLP/Typed-RAG}.
English
Non-factoid question-answering (NFQA) poses a significant challenge due to
its open-ended nature, diverse intents, and the need for multi-aspect
reasoning, which renders conventional factoid QA approaches, including
retrieval-augmented generation (RAG), inadequate. Unlike factoid questions,
non-factoid questions (NFQs) lack definitive answers and require synthesizing
information from multiple sources across various reasoning dimensions. To
address these limitations, we introduce Typed-RAG, a type-aware multi-aspect
decomposition framework within the RAG paradigm for NFQA. Typed-RAG classifies
NFQs into distinct types -- such as debate, experience, and comparison -- and
applies aspect-based decomposition to refine retrieval and generation
strategies. By decomposing multi-aspect NFQs into single-aspect sub-queries and
aggregating the results, Typed-RAG generates more informative and contextually
relevant responses. To evaluate Typed-RAG, we introduce Wiki-NFQA, a benchmark
dataset covering diverse NFQ types. Experimental results demonstrate that
Typed-RAG outperforms baselines, thereby highlighting the importance of
type-aware decomposition for effective retrieval and generation in NFQA. Our
code and dataset are available at
https://github.com/TeamNLP/Typed-RAG{https://github.com/TeamNLP/Typed-RAG}.Summary
AI-Generated Summary