ChatPaper.aiChatPaper

StereoAdapter: ステレオ深度推定を水中シーンに適応させる

StereoAdapter: Adapting Stereo Depth Estimation to Underwater Scenes

September 19, 2025
著者: Zhengri Wu, Yiran Wang, Yu Wen, Zeyu Zhang, Biao Wu, Hao Tang
cs.AI

要旨

水中ステレオ深度推定は、ナビゲーション、検査、マッピングなどのロボティクスタスクに対して正確な3Dジオメトリを提供し、低コストのパッシブカメラからメトリック深度を提供することで、単眼手法のスケール曖昧さを回避します。しかし、既存のアプローチは2つの重要な課題に直面しています:(i) 大規模なビジョンファウンデーションエンコーダを、大量のラベル付きデータなしに水中ドメインにパラメータ効率的に適応させること、(ii) グローバルに一貫性があるがスケール曖昧な単眼事前情報と、局所的にはメトリックであるがフォトメトリック的に脆弱なステレオ対応を密接に融合させること。これらの課題に対処するため、我々はStereoAdapterを提案します。これは、LoRA適応された単眼ファウンデーションエンコーダとリカレントステレオリファインメントモジュールを統合した、パラメータ効率的な自己教師ありフレームワークです。さらに、効率的なランク選択のための動的LoRA適応と、合成データセットUW-StereoDepth-40Kでの事前学習を導入し、多様な水中条件下でのロバスト性を向上させます。シミュレーションおよび実世界のベンチマークでの包括的評価では、TartanAirで6.11%、SQUIDで5.12%の改善を示し、BlueROV2ロボットを用いた実世界での展開でも、本手法の一貫したロバスト性を実証しています。コード: https://github.com/AIGeeksGroup/StereoAdapter. ウェブサイト: https://aigeeksgroup.github.io/StereoAdapter.
English
Underwater stereo depth estimation provides accurate 3D geometry for robotics tasks such as navigation, inspection, and mapping, offering metric depth from low-cost passive cameras while avoiding the scale ambiguity of monocular methods. However, existing approaches face two critical challenges: (i) parameter-efficiently adapting large vision foundation encoders to the underwater domain without extensive labeled data, and (ii) tightly fusing globally coherent but scale-ambiguous monocular priors with locally metric yet photometrically fragile stereo correspondences. To address these challenges, we propose StereoAdapter, a parameter-efficient self-supervised framework that integrates a LoRA-adapted monocular foundation encoder with a recurrent stereo refinement module. We further introduce dynamic LoRA adaptation for efficient rank selection and pre-training on the synthetic UW-StereoDepth-40K dataset to enhance robustness under diverse underwater conditions. Comprehensive evaluations on both simulated and real-world benchmarks show improvements of 6.11% on TartanAir and 5.12% on SQUID compared to state-of-the-art methods, while real-world deployment with the BlueROV2 robot further demonstrates the consistent robustness of our approach. Code: https://github.com/AIGeeksGroup/StereoAdapter. Website: https://aigeeksgroup.github.io/StereoAdapter.
PDF12September 23, 2025