Mapeando e Navegando pelo Atlas de Modelos do Hugging Face

Resumo

Com a existência de milhões de redes neurais publicamente disponíveis, a busca e análise de grandes repositórios de modelos torna-se cada vez mais importante. Navegar por tantos modelos exige um atlas, mas, como a maioria dos modelos é mal documentada, mapear esse atlas é um desafio. Para explorar o potencial oculto dos repositórios de modelos, mapeamos um atlas preliminar que representa a fração documentada do Hugging Face. Ele fornece visualizações impressionantes da paisagem e da evolução dos modelos. Demonstramos várias aplicações desse atlas, incluindo a previsão de atributos de modelos (por exemplo, precisão) e a análise de tendências em modelos de visão computacional. No entanto, como o atlas atual permanece incompleto, propomos um método para mapear regiões não documentadas. Especificamente, identificamos prioridades estruturais de alta confiança com base nas práticas dominantes de treinamento de modelos no mundo real. Ao aproveitar essas prioridades, nossa abordagem permite o mapeamento preciso de áreas anteriormente não documentadas do atlas. Disponibilizamos publicamente nossos conjuntos de dados, código e atlas interativo.

English

As there are now millions of publicly available neural networks, searching and analyzing large model repositories becomes increasingly important. Navigating so many models requires an atlas, but as most models are poorly documented charting such an atlas is challenging. To explore the hidden potential of model repositories, we chart a preliminary atlas representing the documented fraction of Hugging Face. It provides stunning visualizations of the model landscape and evolution. We demonstrate several applications of this atlas including predicting model attributes (e.g., accuracy), and analyzing trends in computer vision models. However, as the current atlas remains incomplete, we propose a method for charting undocumented regions. Specifically, we identify high-confidence structural priors based on dominant real-world model training practices. Leveraging these priors, our approach enables accurate mapping of previously undocumented areas of the atlas. We publicly release our datasets, code, and interactive atlas.

Mapeando e Navegando pelo Atlas de Modelos do Hugging Face

Charting and Navigating Hugging Face's Model Atlas

Resumo

Support