ChatPaper.aiChatPaper

Cartographie et navigation dans l'Atlas des modèles de Hugging Face

Charting and Navigating Hugging Face's Model Atlas

March 13, 2025
Auteurs: Eliahu Horwitz, Nitzan Kurer, Jonathan Kahana, Liel Amar, Yedid Hoshen
cs.AI

Résumé

Avec des millions de réseaux de neurones désormais disponibles publiquement, la recherche et l'analyse de vastes dépôts de modèles deviennent de plus en plus cruciales. Naviguer parmi autant de modèles nécessite un atlas, mais comme la plupart des modèles sont mal documentés, cartographier un tel atlas représente un défi. Pour explorer le potentiel caché des dépôts de modèles, nous avons dressé un atlas préliminaire représentant la fraction documentée de Hugging Face. Celui-ci offre des visualisations saisissantes du paysage et de l'évolution des modèles. Nous démontrons plusieurs applications de cet atlas, notamment la prédiction d'attributs de modèles (par exemple, la précision) et l'analyse des tendances dans les modèles de vision par ordinateur. Cependant, comme l'atlas actuel reste incomplet, nous proposons une méthode pour cartographier les régions non documentées. Plus précisément, nous identifions des préjugés structurels à haute confiance basés sur les pratiques dominantes d'entraînement de modèles dans le monde réel. En exploitant ces préjugés, notre approche permet une cartographie précise des zones précédemment non documentées de l'atlas. Nous rendons publics nos jeux de données, notre code et notre atlas interactif.
English
As there are now millions of publicly available neural networks, searching and analyzing large model repositories becomes increasingly important. Navigating so many models requires an atlas, but as most models are poorly documented charting such an atlas is challenging. To explore the hidden potential of model repositories, we chart a preliminary atlas representing the documented fraction of Hugging Face. It provides stunning visualizations of the model landscape and evolution. We demonstrate several applications of this atlas including predicting model attributes (e.g., accuracy), and analyzing trends in computer vision models. However, as the current atlas remains incomplete, we propose a method for charting undocumented regions. Specifically, we identify high-confidence structural priors based on dominant real-world model training practices. Leveraging these priors, our approach enables accurate mapping of previously undocumented areas of the atlas. We publicly release our datasets, code, and interactive atlas.

Summary

AI-Generated Summary

PDF796March 14, 2025