ChatPaper.aiChatPaper

Kartierung und Navigation durch Hugging Faces Modell-Atlas

Charting and Navigating Hugging Face's Model Atlas

March 13, 2025
Autoren: Eliahu Horwitz, Nitzan Kurer, Jonathan Kahana, Liel Amar, Yedid Hoshen
cs.AI

Zusammenfassung

Da es mittlerweile Millionen öffentlich verfügbarer neuronaler Netze gibt, wird die Suche und Analyse großer Modell-Repositorys immer wichtiger. Die Navigation durch so viele Modelle erfordert einen Atlas, doch da die meisten Modelle nur unzureichend dokumentiert sind, ist die Erstellung eines solchen Atlas eine Herausforderung. Um das verborgene Potenzial von Modell-Repositorys zu erkunden, erstellen wir einen vorläufigen Atlas, der den dokumentierten Teil von Hugging Face repräsentiert. Dieser bietet beeindruckende Visualisierungen der Modelllandschaft und ihrer Entwicklung. Wir demonstrieren mehrere Anwendungen dieses Atlas, einschließlich der Vorhersage von Modellattributen (z. B. Genauigkeit) und der Analyse von Trends in Computervision-Modellen. Da der aktuelle Atlas jedoch unvollständig bleibt, schlagen wir eine Methode zur Kartierung undokumentierter Regionen vor. Insbesondere identifizieren wir hochvertrauenswürdige strukturelle Prioritäten basierend auf dominierenden Praktiken des Modelltrainings in der realen Welt. Durch die Nutzung dieser Prioritäten ermöglicht unser Ansatz eine präzise Kartierung bisher undokumentierter Bereiche des Atlas. Wir veröffentlichen unsere Datensätze, Code und den interaktiven Atlas öffentlich.
English
As there are now millions of publicly available neural networks, searching and analyzing large model repositories becomes increasingly important. Navigating so many models requires an atlas, but as most models are poorly documented charting such an atlas is challenging. To explore the hidden potential of model repositories, we chart a preliminary atlas representing the documented fraction of Hugging Face. It provides stunning visualizations of the model landscape and evolution. We demonstrate several applications of this atlas including predicting model attributes (e.g., accuracy), and analyzing trends in computer vision models. However, as the current atlas remains incomplete, we propose a method for charting undocumented regions. Specifically, we identify high-confidence structural priors based on dominant real-world model training practices. Leveraging these priors, our approach enables accurate mapping of previously undocumented areas of the atlas. We publicly release our datasets, code, and interactive atlas.

Summary

AI-Generated Summary

PDF796March 14, 2025