Trazando y Navegando por el Atlas de Modelos de Hugging Face
Charting and Navigating Hugging Face's Model Atlas
March 13, 2025
Autores: Eliahu Horwitz, Nitzan Kurer, Jonathan Kahana, Liel Amar, Yedid Hoshen
cs.AI
Resumen
Dado que ahora existen millones de redes neuronales disponibles públicamente, la búsqueda y el análisis de grandes repositorios de modelos se vuelve cada vez más importante. Navegar por tantos modelos requiere un atlas, pero como la mayoría de los modelos están mal documentados, trazar dicho atlas es un desafío. Para explorar el potencial oculto de los repositorios de modelos, trazamos un atlas preliminar que representa la fracción documentada de Hugging Face. Este atlas ofrece visualizaciones impresionantes del panorama y la evolución de los modelos. Demostramos varias aplicaciones de este atlas, incluyendo la predicción de atributos de los modelos (por ejemplo, precisión) y el análisis de tendencias en modelos de visión por computadora. Sin embargo, dado que el atlas actual sigue siendo incompleto, proponemos un método para trazar regiones no documentadas. Específicamente, identificamos priores estructurales de alta confianza basados en las prácticas dominantes de entrenamiento de modelos en el mundo real. Al aprovechar estos priores, nuestro enfoque permite mapear con precisión áreas previamente no documentadas del atlas. Publicamos nuestros conjuntos de datos, código y atlas interactivo.
English
As there are now millions of publicly available neural networks, searching
and analyzing large model repositories becomes increasingly important.
Navigating so many models requires an atlas, but as most models are poorly
documented charting such an atlas is challenging. To explore the hidden
potential of model repositories, we chart a preliminary atlas representing the
documented fraction of Hugging Face. It provides stunning visualizations of the
model landscape and evolution. We demonstrate several applications of this
atlas including predicting model attributes (e.g., accuracy), and analyzing
trends in computer vision models. However, as the current atlas remains
incomplete, we propose a method for charting undocumented regions.
Specifically, we identify high-confidence structural priors based on dominant
real-world model training practices. Leveraging these priors, our approach
enables accurate mapping of previously undocumented areas of the atlas. We
publicly release our datasets, code, and interactive atlas.Summary
AI-Generated Summary