ChatPaper.aiChatPaper

StereoAdapter: 스테레오 깊이 추정을 수중 장면에 적용하기

StereoAdapter: Adapting Stereo Depth Estimation to Underwater Scenes

September 19, 2025
저자: Zhengri Wu, Yiran Wang, Yu Wen, Zeyu Zhang, Biao Wu, Hao Tang
cs.AI

초록

수중 스테레오 깊이 추정은 저비용의 수동 카메라를 사용하여 단안 방법의 스케일 불확실성을 피하면서 항법, 검사 및 매핑과 같은 로봇 공학 작업을 위한 정확한 3D 기하학을 제공합니다. 그러나 기존의 접근 방식은 두 가지 중요한 문제에 직면해 있습니다: (i) 대규모 비전 기반 인코더를 수중 도메인에 효율적으로 적응시키면서도 대량의 레이블 데이터 없이 이를 수행하는 것, 그리고 (ii) 전역적으로 일관되지만 스케일이 불확실한 단안 사전 정보와 지역적으로 미터법이지만 광도적으로 취약한 스테레오 대응점을 긴밀하게 융합하는 것입니다. 이러한 문제를 해결하기 위해, 우리는 LoRA-적응 단안 기반 인코더와 순환 스테레오 정제 모듈을 통합한 매개변수 효율적인 자기 지도 프레임워크인 StereoAdapter를 제안합니다. 또한, 다양한 수중 조건에서의 견고성을 향상시키기 위해 합성 UW-StereoDepth-40K 데이터셋에 대한 동적 LoRA 적응과 사전 학습을 도입했습니다. 시뮬레이션 및 실제 벤치마크에 대한 종합적인 평가는 TartanAir에서 6.11%, SQUID에서 5.12%의 개선을 보여주며, BlueROV2 로봇을 사용한 실제 배치에서도 우리 접근 방식의 일관된 견고성을 입증했습니다. 코드: https://github.com/AIGeeksGroup/StereoAdapter. 웹사이트: https://aigeeksgroup.github.io/StereoAdapter.
English
Underwater stereo depth estimation provides accurate 3D geometry for robotics tasks such as navigation, inspection, and mapping, offering metric depth from low-cost passive cameras while avoiding the scale ambiguity of monocular methods. However, existing approaches face two critical challenges: (i) parameter-efficiently adapting large vision foundation encoders to the underwater domain without extensive labeled data, and (ii) tightly fusing globally coherent but scale-ambiguous monocular priors with locally metric yet photometrically fragile stereo correspondences. To address these challenges, we propose StereoAdapter, a parameter-efficient self-supervised framework that integrates a LoRA-adapted monocular foundation encoder with a recurrent stereo refinement module. We further introduce dynamic LoRA adaptation for efficient rank selection and pre-training on the synthetic UW-StereoDepth-40K dataset to enhance robustness under diverse underwater conditions. Comprehensive evaluations on both simulated and real-world benchmarks show improvements of 6.11% on TartanAir and 5.12% on SQUID compared to state-of-the-art methods, while real-world deployment with the BlueROV2 robot further demonstrates the consistent robustness of our approach. Code: https://github.com/AIGeeksGroup/StereoAdapter. Website: https://aigeeksgroup.github.io/StereoAdapter.
PDF12September 23, 2025