LDM3D-VR: Latent Diffusiemodel voor 3D VR
LDM3D-VR: Latent Diffusion Model for 3D VR
November 6, 2023
Auteurs: Gabriela Ben Melech Stan, Diana Wofk, Estelle Aflalo, Shao-Yen Tseng, Zhipeng Cai, Michael Paulitsch, Vasudev Lal
cs.AI
Samenvatting
Latent diffusiemodellen hebben zich bewezen als state-of-the-art in het creëren en manipuleren van visuele uitvoer. Voor zover wij weten, is de gezamenlijke generatie van dieptekaarten met RGB echter nog beperkt. Wij introduceren LDM3D-VR, een suite van diffusiemodellen gericht op virtual reality-ontwikkeling, waaronder LDM3D-pano en LDM3D-SR. Deze modellen maken het mogelijk om panoramische RGBD te genereren op basis van tekstuele prompts en het opschalen van laagresolutie-invoer naar hoogresolutie RGBD, respectievelijk. Onze modellen zijn afgestemd vanuit bestaande vooraf getrainde modellen op datasets die panoramische/hoogresolutie RGB-afbeeldingen, dieptekaarten en bijschriften bevatten. Beide modellen worden geëvalueerd in vergelijking met bestaande gerelateerde methoden.
English
Latent diffusion models have proven to be state-of-the-art in the creation
and manipulation of visual outputs. However, as far as we know, the generation
of depth maps jointly with RGB is still limited. We introduce LDM3D-VR, a suite
of diffusion models targeting virtual reality development that includes
LDM3D-pano and LDM3D-SR. These models enable the generation of panoramic RGBD
based on textual prompts and the upscaling of low-resolution inputs to
high-resolution RGBD, respectively. Our models are fine-tuned from existing
pretrained models on datasets containing panoramic/high-resolution RGB images,
depth maps and captions. Both models are evaluated in comparison to existing
related methods.