Esplorazione e Navigazione nell'Atlante dei Modelli di Hugging Face
Charting and Navigating Hugging Face's Model Atlas
March 13, 2025
Autori: Eliahu Horwitz, Nitzan Kurer, Jonathan Kahana, Liel Amar, Yedid Hoshen
cs.AI
Abstract
Con la disponibilità di milioni di reti neurali pubbliche, la ricerca e l'analisi di grandi repository di modelli sta diventando sempre più importante. Navigare tra così tanti modelli richiede un atlante, ma poiché la maggior parte dei modelli è scarsamente documentata, mappare un tale atlante è una sfida. Per esplorare il potenziale nascosto dei repository di modelli, abbiamo creato un atlante preliminare che rappresenta la frazione documentata di Hugging Face. Questo atlante offre visualizzazioni sorprendenti del panorama e dell'evoluzione dei modelli. Dimostriamo diverse applicazioni di questo atlante, tra cui la previsione di attributi dei modelli (ad esempio, l'accuratezza) e l'analisi delle tendenze nei modelli di visione artificiale. Tuttavia, poiché l'attuale atlante rimane incompleto, proponiamo un metodo per mappare le regioni non documentate. In particolare, identifichiamo prior strutturali ad alta confidenza basate sulle pratiche dominanti di addestramento dei modelli nel mondo reale. Sfruttando queste prior, il nostro approccio consente una mappatura accurata delle aree precedentemente non documentate dell'atlante. Rilasciamo pubblicamente i nostri dataset, il codice e l'atlante interattivo.
English
As there are now millions of publicly available neural networks, searching
and analyzing large model repositories becomes increasingly important.
Navigating so many models requires an atlas, but as most models are poorly
documented charting such an atlas is challenging. To explore the hidden
potential of model repositories, we chart a preliminary atlas representing the
documented fraction of Hugging Face. It provides stunning visualizations of the
model landscape and evolution. We demonstrate several applications of this
atlas including predicting model attributes (e.g., accuracy), and analyzing
trends in computer vision models. However, as the current atlas remains
incomplete, we propose a method for charting undocumented regions.
Specifically, we identify high-confidence structural priors based on dominant
real-world model training practices. Leveraging these priors, our approach
enables accurate mapping of previously undocumented areas of the atlas. We
publicly release our datasets, code, and interactive atlas.