Mapeando e Navegando pelo Atlas de Modelos do Hugging Face
Charting and Navigating Hugging Face's Model Atlas
March 13, 2025
Autores: Eliahu Horwitz, Nitzan Kurer, Jonathan Kahana, Liel Amar, Yedid Hoshen
cs.AI
Resumo
Com a existência de milhões de redes neurais publicamente disponíveis, a busca e análise de grandes repositórios de modelos torna-se cada vez mais importante. Navegar por tantos modelos exige um atlas, mas, como a maioria dos modelos é mal documentada, mapear esse atlas é um desafio. Para explorar o potencial oculto dos repositórios de modelos, mapeamos um atlas preliminar que representa a fração documentada do Hugging Face. Ele fornece visualizações impressionantes da paisagem e da evolução dos modelos. Demonstramos várias aplicações desse atlas, incluindo a previsão de atributos de modelos (por exemplo, precisão) e a análise de tendências em modelos de visão computacional. No entanto, como o atlas atual permanece incompleto, propomos um método para mapear regiões não documentadas. Especificamente, identificamos prioridades estruturais de alta confiança com base nas práticas dominantes de treinamento de modelos no mundo real. Ao aproveitar essas prioridades, nossa abordagem permite o mapeamento preciso de áreas anteriormente não documentadas do atlas. Disponibilizamos publicamente nossos conjuntos de dados, código e atlas interativo.
English
As there are now millions of publicly available neural networks, searching
and analyzing large model repositories becomes increasingly important.
Navigating so many models requires an atlas, but as most models are poorly
documented charting such an atlas is challenging. To explore the hidden
potential of model repositories, we chart a preliminary atlas representing the
documented fraction of Hugging Face. It provides stunning visualizations of the
model landscape and evolution. We demonstrate several applications of this
atlas including predicting model attributes (e.g., accuracy), and analyzing
trends in computer vision models. However, as the current atlas remains
incomplete, we propose a method for charting undocumented regions.
Specifically, we identify high-confidence structural priors based on dominant
real-world model training practices. Leveraging these priors, our approach
enables accurate mapping of previously undocumented areas of the atlas. We
publicly release our datasets, code, and interactive atlas.Summary
AI-Generated Summary