RankEvolve: Автоматизация открытия алгоритмов поиска с помощью эволюции на основе больших языковых моделей
RankEvolve: Automating the Discovery of Retrieval Algorithms via LLM-Driven Evolution
February 18, 2026
Авторы: Jinming Nian, Fangchen Li, Dae Hoon Park, Yi Fang
cs.AI
Аннотация
Алгоритмы поиска, такие как BM25 и правдоподобие запроса со сглаживанием Дирихле, остаются мощными и эффективными ранжировщиками на первом этапе, однако их улучшение в основном достигалось за счет настройки параметров и человеческой интуиции. Мы исследуем, может ли большая языковая модель, направляемая оценщиком и эволюционным поиском, автоматически обнаруживать усовершенствованные лексические алгоритмы поиска. Мы представляем RankEvolve — настройку эволюции программ на основе AlphaEvolve, в которой кандидатные алгоритмы ранжирования представлены в виде исполняемого кода и итеративно мутируют, рекомбинируются и отбираются на основе эффективности поиска по 12 наборам данных ИП из BEIR и BRIGHT. RankEvolve начинается с двух исходных программ: BM25 и правдоподобия запроса со сглаживанием Дирихле. Разработанные алгоритмы являются новыми, эффективными и демонстрируют многообещающую переносимость на полные тесты BEIR и BRIGHT, а также на TREC DL 19 и 20. Наши результаты позволяют предположить, что эволюция программ на основе LLM под руководством оценщика представляет собой практический путь к автоматическому обнаружению новых алгоритмов ранжирования.
English
Retrieval algorithms like BM25 and query likelihood with Dirichlet smoothing remain strong and efficient first-stage rankers, yet improvements have mostly relied on parameter tuning and human intuition. We investigate whether a large language model, guided by an evaluator and evolutionary search, can automatically discover improved lexical retrieval algorithms. We introduce RankEvolve, a program evolution setup based on AlphaEvolve, in which candidate ranking algorithms are represented as executable code and iteratively mutated, recombined, and selected based on retrieval performance across 12 IR datasets from BEIR and BRIGHT. RankEvolve starts from two seed programs: BM25 and query likelihood with Dirichlet smoothing. The evolved algorithms are novel, effective, and show promising transfer to the full BEIR and BRIGHT benchmarks as well as TREC DL 19 and 20. Our results suggest that evaluator-guided LLM program evolution is a practical path towards automatic discovery of novel ranking algorithms.