RE-AdaptIR : Amélioration de la recherche d'information par adaptation rétro-ingéniérée

Résumé

Les grands modèles de langage (LLM) affinés pour la recherche de texte ont démontré des résultats de pointe sur plusieurs benchmarks de recherche d'information (IR). Cependant, l'entraînement supervisé pour améliorer ces modèles nécessite de nombreux exemples étiquetés, qui sont généralement indisponibles ou coûteux à acquérir. Dans ce travail, nous explorons l'efficacité de l'extension de l'adaptation par ingénierie inverse au contexte de la recherche d'information (RE-AdaptIR). Nous utilisons RE-AdaptIR pour améliorer les modèles IR basés sur LLM en utilisant uniquement des données non étiquetées. Nous démontrons une amélioration des performances à la fois dans les domaines d'entraînement et en zero-shot dans des domaines où les modèles n'ont vu aucune requête. Nous analysons les changements de performance dans divers scénarios d'affinage et proposons des résultats immédiatement utiles aux praticiens.

English

Large language models (LLMs) fine-tuned for text-retrieval have demonstrated state-of-the-art results across several information retrieval (IR) benchmarks. However, supervised training for improving these models requires numerous labeled examples, which are generally unavailable or expensive to acquire. In this work, we explore the effectiveness of extending reverse engineered adaptation to the context of information retrieval (RE-AdaptIR). We use RE-AdaptIR to improve LLM-based IR models using only unlabeled data. We demonstrate improved performance both in training domains as well as zero-shot in domains where the models have seen no queries. We analyze performance changes in various fine-tuning scenarios and offer findings of immediate use to practitioners.

RE-AdaptIR : Amélioration de la recherche d'information par adaptation rétro-ingéniérée

RE-AdaptIR: Improving Information Retrieval through Reverse Engineered Adaptation

Résumé

Support