RankEvolve: Automazione della Scoperta di Algoritmi di Recupero tramite Evoluzione Guidata da LLM

Abstract

Algoritmi di recupero come BM25 e la verosimiglianza della query con livellamento di Dirichlet rimangono ranker di primo stadio solidi ed efficienti, sebbene i miglioramenti si siano basati prevalentemente su ottimizzazione dei parametri e intuizione umana. Indaghiamo se un modello linguistico di grandi dimensioni, guidato da un valutatore e da una ricerca evolutiva, possa scoprire automaticamente algoritmi di recupero lessicale migliorati. Introduciamo RankEvolve, un sistema di evoluzione di programmi basato su AlphaEvolve, in cui gli algoritmi di ranking candidati sono rappresentati come codice eseguibile e vengono iterativamente mutati, ricombinati e selezionati in base alle prestazioni di recupero su 12 dataset di IR provenienti da BEIR e BRIGHT. RankEvolve parte da due programmi seme: BM25 e la verosimiglianza della query con livellamento di Dirichlet. Gli algoritmi evoluti sono innovativi, efficaci e mostrano un promettente trasferimento ai benchmark completi di BEIR e BRIGHT, nonché a TREC DL 19 e 20. I nostri risultati suggeriscono che l'evoluzione di programmi LLM guidata da un valutatore rappresenti una strada pratica verso la scoperta automatica di nuovi algoritmi di ranking.

English

Retrieval algorithms like BM25 and query likelihood with Dirichlet smoothing remain strong and efficient first-stage rankers, yet improvements have mostly relied on parameter tuning and human intuition. We investigate whether a large language model, guided by an evaluator and evolutionary search, can automatically discover improved lexical retrieval algorithms. We introduce RankEvolve, a program evolution setup based on AlphaEvolve, in which candidate ranking algorithms are represented as executable code and iteratively mutated, recombined, and selected based on retrieval performance across 12 IR datasets from BEIR and BRIGHT. RankEvolve starts from two seed programs: BM25 and query likelihood with Dirichlet smoothing. The evolved algorithms are novel, effective, and show promising transfer to the full BEIR and BRIGHT benchmarks as well as TREC DL 19 and 20. Our results suggest that evaluator-guided LLM program evolution is a practical path towards automatic discovery of novel ranking algorithms.

RankEvolve: Automazione della Scoperta di Algoritmi di Recupero tramite Evoluzione Guidata da LLM

RankEvolve: Automating the Discovery of Retrieval Algorithms via LLM-Driven Evolution

Abstract

Support