ChatPaper.aiChatPaper

C-RADIOv4 (Технический отчет)

C-RADIOv4 (Tech Report)

January 24, 2026
Авторы: Mike Ranzinger, Greg Heinrich, Collin McCarthy, Jan Kautz, Andrew Tao, Bryan Catanzaro, Pavlo Molchanov
cs.AI

Аннотация

Благодаря использованию дистилляции от нескольких учителей, агломеративные визуальные архитектуры предоставляют единую студенческую модель, которая сохраняет и улучшает уникальные возможности нескольких учителей. В данном техническом отчете мы описываем последний выпуск семейства моделей C-RADIO — C-RADIOv4, который основан на AM-RADIO/RADIOv2.5 по дизайну и предлагает значительное улучшение ключевых downstream-задач при той же вычислительной сложности. Мы выпускаем варианты моделей -SO400M (412 млн параметров) и -H (631 млн), обученные с обновленным набором учителей: SigLIP2, DINOv3 и SAM3. Помимо улучшения ключевых метрик и новых возможностей, полученных за счет имитации SAM3, семейство моделей C-RADIOv4 дополнительно улучшает поддержку любого разрешения, возвращает опцию ViTDet для значительного повышения эффективности при высоком разрешении и сопровождается разрешительной лицензией.
English
By leveraging multi-teacher distillation, agglomerative vision backbones provide a unified student model that retains and improves the distinct capabilities of multiple teachers. In this tech report, we describe the most recent release of the C-RADIO family of models, C-RADIOv4, which builds upon AM-RADIO/RADIOv2.5 in design, offering strong improvements on key downstream tasks at the same computational complexity. We release -SO400M (412M params), and -H (631M) model variants, both trained with an updated set of teachers: SigLIP2, DINOv3, and SAM3. In addition to improvements on core metrics and new capabilities from imitating SAM3, the C-RADIOv4 model family further improves any-resolution support, brings back the ViTDet option for drastically enhanced efficiency at high-resolution, and comes with a permissive license.
PDF82February 3, 2026