Mergenetic: una Libreria Semplice per Modelli Evolutivi di Fusione
Mergenetic: a Simple Evolutionary Model Merging Library
May 16, 2025
Autori: Adrian Robert Minut, Tommaso Mencattini, Andrea Santilli, Donato Crisostomi, Emanuele Rodolà
cs.AI
Abstract
La fusione di modelli consente di combinare le capacità di modelli esistenti in uno nuovo - a posteriori, senza ulteriore addestramento. Questa tecnica è diventata sempre più popolare grazie al suo basso costo e alla disponibilità di librerie che supportano la fusione su GPU consumer. Recenti lavori dimostrano che l'abbinamento della fusione con algoritmi evolutivi può migliorare le prestazioni, ma attualmente non esiste un framework che supporti sperimentazioni flessibili con tali strategie nei modelli linguistici. Introduciamo Mergenetic, una libreria open-source per la fusione evolutiva di modelli. Mergenetic permette una facile composizione di metodi di fusione e algoritmi evolutivi, integrando stimatori leggeri di fitness per ridurre i costi di valutazione. Descriviamo il suo design e dimostriamo che Mergenetic produce risultati competitivi su vari task e lingue utilizzando hardware modesto.
English
Model merging allows combining the capabilities of existing models into a new
one - post hoc, without additional training. This has made it increasingly
popular thanks to its low cost and the availability of libraries that support
merging on consumer GPUs. Recent work shows that pairing merging with
evolutionary algorithms can boost performance, but no framework currently
supports flexible experimentation with such strategies in language models. We
introduce Mergenetic, an open-source library for evolutionary model merging.
Mergenetic enables easy composition of merging methods and evolutionary
algorithms while incorporating lightweight fitness estimators to reduce
evaluation costs. We describe its design and demonstrate that Mergenetic
produces competitive results across tasks and languages using modest hardware.