ChatPaper.aiChatPaper

C-RADIOv4(技術報告書)

C-RADIOv4 (Tech Report)

January 24, 2026
著者: Mike Ranzinger, Greg Heinrich, Collin McCarthy, Jan Kautz, Andrew Tao, Bryan Catanzaro, Pavlo Molchanov
cs.AI

要旨

マルチティーチャー蒸留を活用することで、凝集型ビジョンバックボーンは、複数の教師モデルが持つ特徴的な能力を保持し強化した統一学生モデルを提供します。本テクニカルレポートでは、C-RADIOモデルファミリーの最新リリースであるC-RADIOv4について説明します。このモデルはAM-RADIO/RADIOv2.5の設計を発展させ、同じ計算量ながら主要な下流タスクで大幅な改善を実現しています。私たちは、更新された教師モデル群(SigLIP2、DINOv3、SAM3)で学習された-SO400M(4億1200万パラメータ)と-H(6億3100万パラメータ)の2つのモデル変種を公開しました。コア指標の改善とSAM3の模倣による新機能に加えて、C-RADIOv4モデルファミリーは任意解像度サポートをさらに強化し、高解像度時の効率を大幅に向上させるViTDetオプションを復活させ、より寛容なライセンスを採用しています。
English
By leveraging multi-teacher distillation, agglomerative vision backbones provide a unified student model that retains and improves the distinct capabilities of multiple teachers. In this tech report, we describe the most recent release of the C-RADIO family of models, C-RADIOv4, which builds upon AM-RADIO/RADIOv2.5 in design, offering strong improvements on key downstream tasks at the same computational complexity. We release -SO400M (412M params), and -H (631M) model variants, both trained with an updated set of teachers: SigLIP2, DINOv3, and SAM3. In addition to improvements on core metrics and new capabilities from imitating SAM3, the C-RADIOv4 model family further improves any-resolution support, brings back the ViTDet option for drastically enhanced efficiency at high-resolution, and comes with a permissive license.
PDF82February 3, 2026