CORAL: Avaliação de Referência para Geração de Ampliação de Recuperação Conversacional de Múltiplas VoltasCORAL: Benchmarking Multi-turn Conversational Retrieval-Augmentation
Generation
A Geração com Recuperação (RAG) tornou-se um paradigma poderoso para aprimorar grandes modelos de linguagem (LLMs) por meio da recuperação de conhecimento externo. Apesar da atenção generalizada, a pesquisa acadêmica existente predominantemente se concentra em RAG de turno único, deixando uma lacuna significativa na abordagem das complexidades de conversas multi-turno encontradas em aplicações do mundo real. Para preencher essa lacuna, apresentamos o CORAL, um benchmark em larga escala projetado para avaliar sistemas RAG em cenários realistas de conversação multi-turno. O CORAL inclui conversas diversas em busca de informações derivadas automaticamente da Wikipedia e aborda desafios-chave como cobertura de domínio aberto, intensidade de conhecimento, respostas em formato livre e mudanças de tópico. Ele suporta três tarefas principais de RAG conversacional: recuperação de passagens, geração de respostas e rotulagem de citações. Propomos um framework unificado para padronizar vários métodos de RAG conversacional e realizamos uma avaliação abrangente desses métodos no CORAL, demonstrando oportunidades substanciais para melhorar abordagens existentes.