ChatPaper.aiChatPaper

StereoAdapter-2: Wereldwijd Structureel Consistente Onderwater Stereo Diepteschatting

StereoAdapter-2: Globally Structure-Consistent Underwater Stereo Depth Estimation

February 18, 2026
Auteurs: Zeyu Ren, Xiang Li, Yiran Wang, Zeyu Zhang, Hao Tang
cs.AI

Samenvatting

Stereoscopische diepteschatting is fundamenteel voor de perceptie van onderwaterrobots, maar lijdt onder ernstige domeinverschuivingen veroorzaakt door golflengte-afhankelijke lichtverzwakking, verstrooiing en breking. Recente methoden benutten monocular foundation-modellen met op GRU gebaseerde iteratieve verfijning voor onderwateraanpassing; echter vereisen de sequentiële gating en lokale convolutionele kernels in GRU's meerdere iteraties voor lange-afstands dispariteitspropagatie, wat de prestaties beperkt in onderwatergebieden met grote dispariteit en zonder textuur. In dit artikel stellen we StereoAdapter-2 voor, dat de conventionele ConvGRU-updater vervangt door een nieuwe ConvSS2D-operator gebaseerd op selectieve state space-modellen. De voorgestelde operator gebruikt een vierrichtingen-scanningsstrategie die natuurlijk aansluit bij de epipolaire geometrie, terwijl verticale structurele consistentie wordt behouden, waardoor efficiënte ruimtelijke propagatie over lange afstanden binnen één update-stap mogelijk wordt tegen lineaire computationele complexiteit. Verder construeren we UW-StereoDepth-80K, een grootschalige synthetische onderwater stereodataset met diverse basislijnen, verzwakkingscoëfficiënten en verstrooiingsparameters, gegenereerd via een pijplijn in twee fasen die semantiekbewuste stijloverdracht en geometrie-consistente novel view-synthese combineert. In combinatie met dynamische LoRA-adaptatie, overgenomen van StereoAdapter, behaalt ons framework state-of-the-art zero-shot prestaties op onderwaterbenchmarks met een verbetering van 17% op TartanAir-UW en 7,2% op SQUID, waarbij validatie in de echte wereld op het BlueROV2-platform de robuustheid van onze aanpak aantoont. Code: https://github.com/AIGeeksGroup/StereoAdapter-2. Website: https://aigeeksgroup.github.io/StereoAdapter-2.
English
Stereo depth estimation is fundamental to underwater robotic perception, yet suffers from severe domain shifts caused by wavelength-dependent light attenuation, scattering, and refraction. Recent approaches leverage monocular foundation models with GRU-based iterative refinement for underwater adaptation; however, the sequential gating and local convolutional kernels in GRUs necessitate multiple iterations for long-range disparity propagation, limiting performance in large-disparity and textureless underwater regions. In this paper, we propose StereoAdapter-2, which replaces the conventional ConvGRU updater with a novel ConvSS2D operator based on selective state space models. The proposed operator employs a four-directional scanning strategy that naturally aligns with epipolar geometry while capturing vertical structural consistency, enabling efficient long-range spatial propagation within a single update step at linear computational complexity. Furthermore, we construct UW-StereoDepth-80K, a large-scale synthetic underwater stereo dataset featuring diverse baselines, attenuation coefficients, and scattering parameters through a two-stage generative pipeline combining semantic-aware style transfer and geometry-consistent novel view synthesis. Combined with dynamic LoRA adaptation inherited from StereoAdapter, our framework achieves state-of-the-art zero-shot performance on underwater benchmarks with 17% improvement on TartanAir-UW and 7.2% improvment on SQUID, with real-world validation on the BlueROV2 platform demonstrates the robustness of our approach. Code: https://github.com/AIGeeksGroup/StereoAdapter-2. Website: https://aigeeksgroup.github.io/StereoAdapter-2.
PDF01February 21, 2026