RE-AdaptIR: Melhorando a Recuperação de Informações por meio de Adaptação Engenharia Reversa

Resumo

Grandes modelos de linguagem (LLMs) ajustados para recuperação de texto têm demonstrado resultados de ponta em vários benchmarks de recuperação de informação (IR). No entanto, o treinamento supervisionado para melhorar esses modelos requer inúmeros exemplos rotulados, que geralmente não estão disponíveis ou são caros de adquirir. Neste trabalho, exploramos a eficácia da extensão da adaptação engenharia reversa para o contexto de recuperação de informação (RE-AdaptIR). Utilizamos o RE-AdaptIR para melhorar modelos de IR baseados em LLM usando apenas dados não rotulados. Demonstramos um desempenho aprimorado tanto em domínios de treinamento quanto em domínios de zero-shot nos quais os modelos não viram consultas. Analisamos as mudanças de desempenho em vários cenários de ajuste fino e oferecemos descobertas de uso imediato para os profissionais.

English

Large language models (LLMs) fine-tuned for text-retrieval have demonstrated state-of-the-art results across several information retrieval (IR) benchmarks. However, supervised training for improving these models requires numerous labeled examples, which are generally unavailable or expensive to acquire. In this work, we explore the effectiveness of extending reverse engineered adaptation to the context of information retrieval (RE-AdaptIR). We use RE-AdaptIR to improve LLM-based IR models using only unlabeled data. We demonstrate improved performance both in training domains as well as zero-shot in domains where the models have seen no queries. We analyze performance changes in various fine-tuning scenarios and offer findings of immediate use to practitioners.

RE-AdaptIR: Melhorando a Recuperação de Informações por meio de Adaptação Engenharia Reversa

RE-AdaptIR: Improving Information Retrieval through Reverse Engineered Adaptation

Resumo

Support