ChatPaper.aiChatPaper

C-RADIOv4 (Informe Técnico)

C-RADIOv4 (Tech Report)

January 24, 2026
Autores: Mike Ranzinger, Greg Heinrich, Collin McCarthy, Jan Kautz, Andrew Tao, Bryan Catanzaro, Pavlo Molchanov
cs.AI

Resumen

Al aprovechar la destilación multi-maestro, los *backbones* visuales aglomerativos proporcionan un modelo estudiantil unificado que retiene y mejora las capacidades distintivas de múltiples maestros. En este informe técnico, describimos la versión más reciente de la familia de modelos C-RADIO, C-RADIOv4, que se basa en el diseño de AM-RADIO/RADIOv2.5, ofreciendo mejoras significativas en tareas *downstream* clave con la misma complejidad computacional. Publicamos las variantes del modelo -SO400M (412M parámetros) y -H (631M), ambas entrenadas con un conjunto actualizado de maestros: SigLIP2, DINOv3 y SAM3. Además de las mejoras en las métricas principales y las nuevas capacidades derivadas de imitar a SAM3, la familia de modelos C-RADIOv4 mejora aún más el soporte para cualquier resolución, recupera la opción ViTDet para una eficiencia drásticamente mejorada en alta resolución, y se distribuye con una licencia permisiva.
English
By leveraging multi-teacher distillation, agglomerative vision backbones provide a unified student model that retains and improves the distinct capabilities of multiple teachers. In this tech report, we describe the most recent release of the C-RADIO family of models, C-RADIOv4, which builds upon AM-RADIO/RADIOv2.5 in design, offering strong improvements on key downstream tasks at the same computational complexity. We release -SO400M (412M params), and -H (631M) model variants, both trained with an updated set of teachers: SigLIP2, DINOv3, and SAM3. In addition to improvements on core metrics and new capabilities from imitating SAM3, the C-RADIOv4 model family further improves any-resolution support, brings back the ViTDet option for drastically enhanced efficiency at high-resolution, and comes with a permissive license.
PDF82February 3, 2026