ChatPaper.aiChatPaper

Составление карты и навигация по Атласу моделей Hugging Face

Charting and Navigating Hugging Face's Model Atlas

March 13, 2025
Авторы: Eliahu Horwitz, Nitzan Kurer, Jonathan Kahana, Liel Amar, Yedid Hoshen
cs.AI

Аннотация

Поскольку сейчас доступны миллионы публичных нейронных сетей, поиск и анализ больших репозиториев моделей становится все более важным. Навигация по такому количеству моделей требует атласа, но поскольку большинство моделей плохо документированы, создание такого атласа является сложной задачей. Чтобы исследовать скрытый потенциал репозиториев моделей, мы создаем предварительный атлас, представляющий документированную часть Hugging Face. Он предоставляет впечатляющие визуализации ландшафта и эволюции моделей. Мы демонстрируем несколько применений этого атласа, включая прогнозирование атрибутов моделей (например, точности) и анализ тенденций в моделях компьютерного зрения. Однако, поскольку текущий атлас остается неполным, мы предлагаем метод для картирования недокументированных областей. В частности, мы определяем структурные априори с высокой степенью уверенности, основанные на доминирующих практиках обучения моделей в реальном мире. Используя эти априори, наш подход позволяет точно картировать ранее недокументированные области атласа. Мы публично выпускаем наши наборы данных, код и интерактивный атлас.
English
As there are now millions of publicly available neural networks, searching and analyzing large model repositories becomes increasingly important. Navigating so many models requires an atlas, but as most models are poorly documented charting such an atlas is challenging. To explore the hidden potential of model repositories, we chart a preliminary atlas representing the documented fraction of Hugging Face. It provides stunning visualizations of the model landscape and evolution. We demonstrate several applications of this atlas including predicting model attributes (e.g., accuracy), and analyzing trends in computer vision models. However, as the current atlas remains incomplete, we propose a method for charting undocumented regions. Specifically, we identify high-confidence structural priors based on dominant real-world model training practices. Leveraging these priors, our approach enables accurate mapping of previously undocumented areas of the atlas. We publicly release our datasets, code, and interactive atlas.

Summary

AI-Generated Summary

PDF796March 14, 2025