ChatPaper.aiChatPaper

Dieptelab: Van Gedeeltelijk naar Compleet

DepthLab: From Partial to Complete

December 24, 2024
Auteurs: Zhiheng Liu, Ka Leong Cheng, Qiuyu Wang, Shuzhe Wang, Hao Ouyang, Bin Tan, Kai Zhu, Yujun Shen, Qifeng Chen, Ping Luo
cs.AI

Samenvatting

Ontbrekende waarden blijven een veelvoorkomende uitdaging voor dieptedata in een breed scala van toepassingen, voortkomend uit verschillende oorzaken zoals onvolledige gegevensverzameling en perspectiefverandering. Dit werk overbrugt deze kloof met DepthLab, een basis dieptevervullingsmodel aangedreven door beeldverspreidingsprioriteiten. Ons model heeft twee opmerkelijke sterke punten: (1) het toont veerkracht tegenover dieptetekortgebieden, waardoor betrouwbare voltooiing mogelijk is voor zowel continue gebieden als geïsoleerde punten, en (2) het behoudt nauwkeurig de schaalconsistentie met de geconditioneerde bekende diepte bij het invullen van ontbrekende waarden. Puttend uit deze voordelen, bewijst onze benadering haar waarde in verschillende downstreamtaken, waaronder 3D-scenevervulling, tekst-naar-3D-scene-generatie, schaars-beeldreconstructie met DUST3R, en LiDAR-dieptevervulling, waarbij de huidige oplossingen worden overtroffen op zowel numerieke prestaties als visuele kwaliteit. Onze projectpagina met broncode is beschikbaar op https://johanan528.github.io/depthlab_web/.
English
Missing values remain a common challenge for depth data across its wide range of applications, stemming from various causes like incomplete data acquisition and perspective alteration. This work bridges this gap with DepthLab, a foundation depth inpainting model powered by image diffusion priors. Our model features two notable strengths: (1) it demonstrates resilience to depth-deficient regions, providing reliable completion for both continuous areas and isolated points, and (2) it faithfully preserves scale consistency with the conditioned known depth when filling in missing values. Drawing on these advantages, our approach proves its worth in various downstream tasks, including 3D scene inpainting, text-to-3D scene generation, sparse-view reconstruction with DUST3R, and LiDAR depth completion, exceeding current solutions in both numerical performance and visual quality. Our project page with source code is available at https://johanan528.github.io/depthlab_web/.
PDF362December 25, 2024