RankEvolve : Automatisation de la Découverte d'Algorithmes de Recherche par Évolution Pilotée par LLM

Résumé

Des algorithmes de récupération comme BM25 et le modèle de vraisemblance de requête avec lissage de Dirichlet demeurent des classificateurs de première étape solides et efficaces, mais les améliorations ont surtout reposé sur le réglage des paramètres et l'intuition humaine. Nous étudions si un grand modèle de langage, guidé par un évaluateur et une recherche évolutive, peut découvrir automatiquement des algorithmes de récupération lexicale améliorés. Nous présentons RankEvolve, un cadre d'évolution de programmes basé sur AlphaEvolve, dans lequel les algorithmes de classement candidats sont représentés sous forme de code exécutable et sont mutés, recombinés et sélectionnés itérativement sur la base de leurs performances de récupération sur 12 jeux de données RI issus de BEIR et BRIGHT. RankEvolve part de deux programmes de base : BM25 et le modèle de vraisemblance de requête avec lissage de Dirichlet. Les algorithmes évolués sont nouveaux, efficaces et montrent un transfert prometteur vers les benchmarks complets de BEIR et BRIGHT, ainsi que vers TREC DL 19 et 20. Nos résultats suggèrent que l'évolution de programmes par grands modèles de langage guidée par un évaluateur est une voie pratique vers la découverte automatique de nouveaux algorithmes de classement.

English

Retrieval algorithms like BM25 and query likelihood with Dirichlet smoothing remain strong and efficient first-stage rankers, yet improvements have mostly relied on parameter tuning and human intuition. We investigate whether a large language model, guided by an evaluator and evolutionary search, can automatically discover improved lexical retrieval algorithms. We introduce RankEvolve, a program evolution setup based on AlphaEvolve, in which candidate ranking algorithms are represented as executable code and iteratively mutated, recombined, and selected based on retrieval performance across 12 IR datasets from BEIR and BRIGHT. RankEvolve starts from two seed programs: BM25 and query likelihood with Dirichlet smoothing. The evolved algorithms are novel, effective, and show promising transfer to the full BEIR and BRIGHT benchmarks as well as TREC DL 19 and 20. Our results suggest that evaluator-guided LLM program evolution is a practical path towards automatic discovery of novel ranking algorithms.

RankEvolve : Automatisation de la Découverte d'Algorithmes de Recherche par Évolution Pilotée par LLM

RankEvolve: Automating the Discovery of Retrieval Algorithms via LLM-Driven Evolution

Résumé

Support