ChatPaper.aiChatPaper

Track, Inpaint, Resplat: Generazione 3D e 4D guidata dal soggetto con Riempimento Texture Progressivo

Track, Inpaint, Resplat: Subject-driven 3D and 4D Generation with Progressive Texture Infilling

October 27, 2025
Autori: Shuhong Zheng, Ashkan Mirzaei, Igor Gilitschenski
cs.AI

Abstract

I metodi attuali di generazione 3D/4D sono generalmente ottimizzati per il fotorealismo, l'efficienza e l'estetica. Tuttavia, spesso non riescono a preservare l'identità semantica del soggetto attraverso diversi punti di vista. L'adattamento dei metodi di generazione con una o poche immagini di un soggetto specifico (noto anche come Personalizzazione o Generazione guidata dal soggetto) consente di generare contenuti visivi che si allineano con l'identità del soggetto. Tuttavia, la generazione 3D/4D personalizzata è ancora in gran parte inesplorata. In questo lavoro, introduciamo TIRE (Track, Inpaint, REsplat), un nuovo metodo per la generazione 3D/4D guidata dal soggetto. Il metodo prende in input un asset 3D iniziale prodotto da un modello generativo 3D esistente e utilizza il tracciamento video per identificare le regioni che necessitano di modifica. Successivamente, adottiamo un modello di inpaint 2D guidato dal soggetto per riempire progressivamente le regioni identificate. Infine, risplattiamo le osservazioni 2D multi-vista modificate nuovamente in 3D mantenendo la coerenza. Esperimenti estensivi dimostrano che il nostro approccio migliora significativamente la preservazione dell'identità nella generazione 3D/4D rispetto ai metodi allo stato dell'arte. Il nostro sito web del progetto è disponibile all'indirizzo https://zsh2000.github.io/track-inpaint-resplat.github.io/.
English
Current 3D/4D generation methods are usually optimized for photorealism, efficiency, and aesthetics. However, they often fail to preserve the semantic identity of the subject across different viewpoints. Adapting generation methods with one or few images of a specific subject (also known as Personalization or Subject-driven generation) allows generating visual content that align with the identity of the subject. However, personalized 3D/4D generation is still largely underexplored. In this work, we introduce TIRE (Track, Inpaint, REsplat), a novel method for subject-driven 3D/4D generation. It takes an initial 3D asset produced by an existing 3D generative model as input and uses video tracking to identify the regions that need to be modified. Then, we adopt a subject-driven 2D inpainting model for progressively infilling the identified regions. Finally, we resplat the modified 2D multi-view observations back to 3D while still maintaining consistency. Extensive experiments demonstrate that our approach significantly improves identity preservation in 3D/4D generation compared to state-of-the-art methods. Our project website is available at https://zsh2000.github.io/track-inpaint-resplat.github.io/.
PDF51December 3, 2025