SpaceBlender : Création d'espaces collaboratifs riches en contexte grâce à la fusion générative de scènes 3D

papers.abstract

Il y a un intérêt croissant à utiliser l'IA générative pour créer des espaces 3D pour les applications de Réalité Virtuelle (RV). Cependant, les modèles actuels produisent des environnements artificiels, ne parvenant pas à soutenir les tâches collaboratives qui bénéficient de l'intégration du contexte physique de l'utilisateur. Pour générer des environnements qui soutiennent la téléprésence en RV, nous présentons SpaceBlender, un nouveau processus qui utilise des techniques d'IA générative pour mélanger les environnements physiques des utilisateurs dans des espaces virtuels unifiés. Ce processus transforme des images 2D fournies par l'utilisateur en environnements 3D riches en contexte à travers un processus itératif comprenant l'estimation de la profondeur, l'alignement des maillages et l'achèvement de l'espace basé sur la diffusion guidée par des prédictions géométriques et des invitations textuelles adaptatives. Dans une étude préliminaire en intra-sujets, où 20 participants ont réalisé une tâche collaborative de diagramme d'affinité en RV en binômes, nous avons comparé SpaceBlender avec un environnement virtuel générique et un cadre de génération de scène de pointe, évaluant sa capacité à créer des espaces virtuels adaptés à la collaboration. Les participants ont apprécié la familiarité améliorée et le contexte fourni par SpaceBlender, mais ont également noté des complexités dans les environnements génératifs qui pourraient détourner l'attention de la tâche. En nous appuyant sur les retours des participants, nous proposons des pistes d'amélioration du processus et discutons de la valeur et de la conception des espaces mixtes pour différents scénarios.

English

There is increased interest in using generative AI to create 3D spaces for Virtual Reality (VR) applications. However, today's models produce artificial environments, falling short of supporting collaborative tasks that benefit from incorporating the user's physical context. To generate environments that support VR telepresence, we introduce SpaceBlender, a novel pipeline that utilizes generative AI techniques to blend users' physical surroundings into unified virtual spaces. This pipeline transforms user-provided 2D images into context-rich 3D environments through an iterative process consisting of depth estimation, mesh alignment, and diffusion-based space completion guided by geometric priors and adaptive text prompts. In a preliminary within-subjects study, where 20 participants performed a collaborative VR affinity diagramming task in pairs, we compared SpaceBlender with a generic virtual environment and a state-of-the-art scene generation framework, evaluating its ability to create virtual spaces suitable for collaboration. Participants appreciated the enhanced familiarity and context provided by SpaceBlender but also noted complexities in the generative environments that could detract from task focus. Drawing on participant feedback, we propose directions for improving the pipeline and discuss the value and design of blended spaces for different scenarios.

SpaceBlender : Création d'espaces collaboratifs riches en contexte grâce à la fusion générative de scènes 3D

SpaceBlender: Creating Context-Rich Collaborative Spaces Through Generative 3D Scene Blending

papers.abstract

Support