C-RADIOv4 (기술 보고서)
C-RADIOv4 (Tech Report)
January 24, 2026
저자: Mike Ranzinger, Greg Heinrich, Collin McCarthy, Jan Kautz, Andrew Tao, Bryan Catanzaro, Pavlo Molchanov
cs.AI
초록
다중 교사 지식 증류를 활용함으로써, 응집적 비전 백본은 여러 교사 모델의 고유한 역량을 유지 및 개선하는 통합 학생 모델을 제공합니다. 본 기술 보고서에서는 AM-RADIO/RADIOv2.5 설계를 기반으로 동일한 계산 복잡도에서 주요 다운스트림 작업에 대한 강력한 성능 향상을 제공하는 C-RADIO 모델 패밀리의 최신 버전인 C-RADIOv4를 설명합니다. 우리는 업데이트된 교사 모델 세트(SigLIP2, DINOv3, SAM3)로 학습된 -SO400M(4억 1,200만 개 매개변수) 및 -H(6억 3,100만 개) 모델 변종을 공개합니다. 핵심 메트릭 개선 및 SAM3 모방을 통한 새로운 역량 외에도, C-RADIOv4 모델 패밀리는 임의 해상도 지원을 더욱 개선하고, 고해상도에서 극적으로 향상된 효율성을 위한 ViTDet 옵션을 다시 도입하였으며, 허용 라이선스를 제공합니다.
English
By leveraging multi-teacher distillation, agglomerative vision backbones provide a unified student model that retains and improves the distinct capabilities of multiple teachers. In this tech report, we describe the most recent release of the C-RADIO family of models, C-RADIOv4, which builds upon AM-RADIO/RADIOv2.5 in design, offering strong improvements on key downstream tasks at the same computational complexity. We release -SO400M (412M params), and -H (631M) model variants, both trained with an updated set of teachers: SigLIP2, DINOv3, and SAM3. In addition to improvements on core metrics and new capabilities from imitating SAM3, the C-RADIOv4 model family further improves any-resolution support, brings back the ViTDet option for drastically enhanced efficiency at high-resolution, and comes with a permissive license.