Mergenetic: Uma Biblioteca Simples de Modelo Evolutivo de Fusão
Mergenetic: a Simple Evolutionary Model Merging Library
May 16, 2025
Autores: Adrian Robert Minut, Tommaso Mencattini, Andrea Santilli, Donato Crisostomi, Emanuele Rodolà
cs.AI
Resumo
A fusão de modelos permite combinar as capacidades de modelos existentes em um novo - de forma pós-hoc, sem treinamento adicional. Isso tem se tornado cada vez mais popular graças ao seu baixo custo e à disponibilidade de bibliotecas que suportam a fusão em GPUs de consumo. Trabalhos recentes mostram que combinar a fusão com algoritmos evolutivos pode impulsionar o desempenho, mas nenhum framework atualmente suporta experimentação flexível com tais estratégias em modelos de linguagem. Apresentamos o Mergenetic, uma biblioteca de código aberto para fusão evolutiva de modelos. O Mergenetic permite a fácil composição de métodos de fusão e algoritmos evolutivos, incorporando estimadores leves de aptidão para reduzir os custos de avaliação. Descrevemos seu design e demonstramos que o Mergenetic produz resultados competitivos em diversas tarefas e idiomas utilizando hardware modesto.
English
Model merging allows combining the capabilities of existing models into a new
one - post hoc, without additional training. This has made it increasingly
popular thanks to its low cost and the availability of libraries that support
merging on consumer GPUs. Recent work shows that pairing merging with
evolutionary algorithms can boost performance, but no framework currently
supports flexible experimentation with such strategies in language models. We
introduce Mergenetic, an open-source library for evolutionary model merging.
Mergenetic enables easy composition of merging methods and evolutionary
algorithms while incorporating lightweight fitness estimators to reduce
evaluation costs. We describe its design and demonstrate that Mergenetic
produces competitive results across tasks and languages using modest hardware.