ロボブレイン2.5:視覚の深度、時間の認識
RoboBrain 2.5: Depth in Sight, Time in Mind
January 20, 2026
著者: Huajie Tan, Enshen Zhou, Zhiyu Li, Yijie Xu, Yuheng Ji, Xiansheng Chen, Cheng Chi, Pengwei Wang, Huizhu Jia, Yulong Ao, Mingyu Cao, Sixiang Chen, Zhe Li, Mengzhen Liu, Zixiao Wang, Shanyu Rong, Yaoxu Lyu, Zhongxia Zhao, Peterson Co, Yibo Li, Yi Han, Shaoxuan Xie, Guocai Yao, Songjing Wang, Leiduo Zhang, Xi Yang, Yance Jiao, Donghai Shi, Kunchang Xie, Shaokai Nie, Chunlei Men, Yonghua Lin, Zhongyuan Wang, Tiejun Huang, Shanghang Zhang
cs.AI
要旨
本論文では、高品質な時空間的教師データを用いた大規模訓練により、汎用的知覚・空間推論・時間モデリングを発展させた次世代具身AI基盤モデル「RoboBrain 2.5」を提案する。前身モデルを発展させ、本モデルは二つの主要能力向上を実現している。具体的には、2Dピクセル相対的接地から深度認識座標予測および絶対的メートル法制約理解へ転換することで、物理的制約下で順序付けられたキーポイント列として完全な3D操作軌跡を生成する「精密3D空間推論」を実現。さらにこの空間的精度を補完する「稠密時間的価値推定」により、視点変化に跨るステップ対応の進捗予測と実行状態理解を提供し、下流学習のための安定したフィードバック信号を生成する。これらの向上により、複雑で細粒度な操作タスクに向け、物理的接地性と実行認識性を強化した具身知能フレームワークを構築する。コード及びチェックポイントはプロジェクトウェブサイト(https://superrobobrain.github.io)で公開されている。
English
We introduce RoboBrain 2.5, a next-generation embodied AI foundation model that advances general perception, spatial reasoning, and temporal modeling through extensive training on high-quality spatiotemporal supervision. Building upon its predecessor, RoboBrain 2.5 introduces two major capability upgrades. Specifically, it unlocks Precise 3D Spatial Reasoning by shifting from 2D pixel-relative grounding to depth-aware coordinate prediction and absolute metric constraint comprehension, generating complete 3D manipulation traces as ordered keypoint sequences under physical constraints. Complementing this spatial precision, the model establishes Dense Temporal Value Estimation that provides dense, step-aware progress prediction and execution state understanding across varying viewpoints, producing stable feedback signals for downstream learning. Together, these upgrades extend the framework toward more physically grounded and execution-aware embodied intelligence for complex, fine-grained manipulation. The code and checkpoints are available at project website: https://superrobobrain.github.io