ChatPaper.aiChatPaper

Mergenetic: una Libreria Semplice per Modelli Evolutivi di Fusione

Mergenetic: a Simple Evolutionary Model Merging Library

May 16, 2025
Autori: Adrian Robert Minut, Tommaso Mencattini, Andrea Santilli, Donato Crisostomi, Emanuele Rodolà
cs.AI

Abstract

La fusione di modelli consente di combinare le capacità di modelli esistenti in uno nuovo - a posteriori, senza ulteriore addestramento. Questa tecnica è diventata sempre più popolare grazie al suo basso costo e alla disponibilità di librerie che supportano la fusione su GPU consumer. Recenti lavori dimostrano che l'abbinamento della fusione con algoritmi evolutivi può migliorare le prestazioni, ma attualmente non esiste un framework che supporti sperimentazioni flessibili con tali strategie nei modelli linguistici. Introduciamo Mergenetic, una libreria open-source per la fusione evolutiva di modelli. Mergenetic permette una facile composizione di metodi di fusione e algoritmi evolutivi, integrando stimatori leggeri di fitness per ridurre i costi di valutazione. Descriviamo il suo design e dimostriamo che Mergenetic produce risultati competitivi su vari task e lingue utilizzando hardware modesto.
English
Model merging allows combining the capabilities of existing models into a new one - post hoc, without additional training. This has made it increasingly popular thanks to its low cost and the availability of libraries that support merging on consumer GPUs. Recent work shows that pairing merging with evolutionary algorithms can boost performance, but no framework currently supports flexible experimentation with such strategies in language models. We introduce Mergenetic, an open-source library for evolutionary model merging. Mergenetic enables easy composition of merging methods and evolutionary algorithms while incorporating lightweight fitness estimators to reduce evaluation costs. We describe its design and demonstrate that Mergenetic produces competitive results across tasks and languages using modest hardware.
PDF142May 19, 2025