Trazando y Navegando por el Atlas de Modelos de Hugging Face

Resumen

Dado que ahora existen millones de redes neuronales disponibles públicamente, la búsqueda y el análisis de grandes repositorios de modelos se vuelve cada vez más importante. Navegar por tantos modelos requiere un atlas, pero como la mayoría de los modelos están mal documentados, trazar dicho atlas es un desafío. Para explorar el potencial oculto de los repositorios de modelos, trazamos un atlas preliminar que representa la fracción documentada de Hugging Face. Este atlas ofrece visualizaciones impresionantes del panorama y la evolución de los modelos. Demostramos varias aplicaciones de este atlas, incluyendo la predicción de atributos de los modelos (por ejemplo, precisión) y el análisis de tendencias en modelos de visión por computadora. Sin embargo, dado que el atlas actual sigue siendo incompleto, proponemos un método para trazar regiones no documentadas. Específicamente, identificamos priores estructurales de alta confianza basados en las prácticas dominantes de entrenamiento de modelos en el mundo real. Al aprovechar estos priores, nuestro enfoque permite mapear con precisión áreas previamente no documentadas del atlas. Publicamos nuestros conjuntos de datos, código y atlas interactivo.

English

As there are now millions of publicly available neural networks, searching and analyzing large model repositories becomes increasingly important. Navigating so many models requires an atlas, but as most models are poorly documented charting such an atlas is challenging. To explore the hidden potential of model repositories, we chart a preliminary atlas representing the documented fraction of Hugging Face. It provides stunning visualizations of the model landscape and evolution. We demonstrate several applications of this atlas including predicting model attributes (e.g., accuracy), and analyzing trends in computer vision models. However, as the current atlas remains incomplete, we propose a method for charting undocumented regions. Specifically, we identify high-confidence structural priors based on dominant real-world model training practices. Leveraging these priors, our approach enables accurate mapping of previously undocumented areas of the atlas. We publicly release our datasets, code, and interactive atlas.

Trazando y Navegando por el Atlas de Modelos de Hugging Face

Charting and Navigating Hugging Face's Model Atlas

Resumen

Support