ワンステージでの深度補完のためのDepth Anythingへのプロンプティング:AnyからFullへ
Any to Full: Prompting Depth Anything for Depth Completion in One Stage
March 5, 2026
著者: Zhiyuan Zhou, Ruofeng Liu, Taichi Liu, Weijian Zuo, Shanshan Wang, Zhiqing Hong, Desheng Zhang
cs.AI
要旨
精密で高密度な深度推定はロボット知覚において重要であるが、市販のセンサーはハードウェアの制約により、しばしば疎あるいは不完全な計測値しか得られない。既存のRGBD融合型深度補完手法は、学習用RGB分布と特定の深度パターンに条件付けられた事前分布を共同で学習するため、ドメイン汎化性や様々な深度パターンへの頑健性が制限される。最近の研究では、単眼深度推定(MDE)モデルを活用してドメインに依存しない幾何学的事前知識を導入するが、現在の2段階統合戦略は明示的な相対値-絶対値のアラインメントに依存するため、追加の計算コストがかかり、構造的な歪みが生じる。そこで本研究では、Any2Fullを提案する。これは、事前学習済みMDEモデルのスケールプロンプティング適応として補完問題を再定式化する、一段階式、ドメイン汎用、パターン非依存のフレームワークである。様々な深度スパース性レベルと不規則な空間分布に対処するため、Scale-Aware Prompt Encoderを設計した。これは疎な入力からスケール手がかりを抽出し、統一されたスケールプロンプトに変換し、幾何学的事前知識を保持しつつMDEモデルを大域的にスケール整合性のある予測へと導く。大規模な実験により、Any2Fullが優れた頑健性と効率性を達成することを実証した。平均AbsRELにおいてOMNI-DCを32.2%上回り、同じMDEバックボーンを用いたPriorDAと比較して1.4倍の高速化を実現し、汎用深度補完の新たなパラダイムを確立する。コードとチェックポイントはhttps://github.com/zhiyuandaily/Any2Full で公開されている。
English
Accurate, dense depth estimation is crucial for robotic perception, but commodity sensors often yield sparse or incomplete measurements due to hardware limitations. Existing RGBD-fused depth completion methods learn priors jointly conditioned on training RGB distribution and specific depth patterns, limiting domain generalization and robustness to various depth patterns. Recent efforts leverage monocular depth estimation (MDE) models to introduce domain-general geometric priors, but current two-stage integration strategies relying on explicit relative-to-metric alignment incur additional computation and introduce structured distortions. To this end, we present Any2Full, a one-stage, domain-general, and pattern-agnostic framework that reformulates completion as a scale-prompting adaptation of a pretrained MDE model. To address varying depth sparsity levels and irregular spatial distributions, we design a Scale-Aware Prompt Encoder. It distills scale cues from sparse inputs into unified scale prompts, guiding the MDE model toward globally scale-consistent predictions while preserving its geometric priors. Extensive experiments demonstrate that Any2Full achieves superior robustness and efficiency. It outperforms OMNI-DC by 32.2\% in average AbsREL and delivers a 1.4times speedup over PriorDA with the same MDE backbone, establishing a new paradigm for universal depth completion. Codes and checkpoints are available at https://github.com/zhiyuandaily/Any2Full.