ChatPaper.aiChatPaper

Esplorazione e Navigazione nell'Atlante dei Modelli di Hugging Face

Charting and Navigating Hugging Face's Model Atlas

March 13, 2025
Autori: Eliahu Horwitz, Nitzan Kurer, Jonathan Kahana, Liel Amar, Yedid Hoshen
cs.AI

Abstract

Con la disponibilità di milioni di reti neurali pubbliche, la ricerca e l'analisi di grandi repository di modelli sta diventando sempre più importante. Navigare tra così tanti modelli richiede un atlante, ma poiché la maggior parte dei modelli è scarsamente documentata, mappare un tale atlante è una sfida. Per esplorare il potenziale nascosto dei repository di modelli, abbiamo creato un atlante preliminare che rappresenta la frazione documentata di Hugging Face. Questo atlante offre visualizzazioni sorprendenti del panorama e dell'evoluzione dei modelli. Dimostriamo diverse applicazioni di questo atlante, tra cui la previsione di attributi dei modelli (ad esempio, l'accuratezza) e l'analisi delle tendenze nei modelli di visione artificiale. Tuttavia, poiché l'attuale atlante rimane incompleto, proponiamo un metodo per mappare le regioni non documentate. In particolare, identifichiamo prior strutturali ad alta confidenza basate sulle pratiche dominanti di addestramento dei modelli nel mondo reale. Sfruttando queste prior, il nostro approccio consente una mappatura accurata delle aree precedentemente non documentate dell'atlante. Rilasciamo pubblicamente i nostri dataset, il codice e l'atlante interattivo.
English
As there are now millions of publicly available neural networks, searching and analyzing large model repositories becomes increasingly important. Navigating so many models requires an atlas, but as most models are poorly documented charting such an atlas is challenging. To explore the hidden potential of model repositories, we chart a preliminary atlas representing the documented fraction of Hugging Face. It provides stunning visualizations of the model landscape and evolution. We demonstrate several applications of this atlas including predicting model attributes (e.g., accuracy), and analyzing trends in computer vision models. However, as the current atlas remains incomplete, we propose a method for charting undocumented regions. Specifically, we identify high-confidence structural priors based on dominant real-world model training practices. Leveraging these priors, our approach enables accurate mapping of previously undocumented areas of the atlas. We publicly release our datasets, code, and interactive atlas.
PDF846March 14, 2025