MorphAny3D: Entfesselung der Leistungsfähigkeit strukturierter latenter Räume für 3D-Morphing
MorphAny3D: Unleashing the Power of Structured Latent in 3D Morphing
January 1, 2026
papers.authors: Xiaokun Sun, Zeyu Cai, Hao Tang, Ying Tai, Jian Yang, Zhenyu Zhang
cs.AI
papers.abstract
3D-Morphing bleibt aufgrund der Schwierigkeit, semantisch konsistente und zeitlich flüssige Verformungen zu erzeugen, eine Herausforderung, insbesondere über Kategorien hinweg. Wir stellen MorphAny3D vor, ein trainierungsfreies Framework, das Structured Latent (SLAT)-Repräsentationen für hochwertiges 3D-Morphing nutzt. Unser zentraler Ansatz ist, dass ein intelligentes Mischen von Quell- und Ziel-SLAT-Features innerhalb der Attention-Mechanismen von 3D-Generatoren auf natürliche Weise plausible Morphing-Sequenzen erzeugt. Zu diesem Zweck führen wir Morphing Cross-Attention (MCA) ein, die Quell- und Zielinformationen für strukturelle Kohärenz fusioniert, sowie Temporal-Fused Self-Attention (TFSA), die die zeitliche Konsistenz durch die Einbeziehung von Features vorheriger Frames verbessert. Eine Orientierungskorrektur-Strategie mildert zudem die Posierungsmehrdeutigkeit innerhalb der Morphing-Schritte weiter ab. Umfangreiche Experimente zeigen, dass unsere Methode state-of-the-art Morphing-Sequenzen erzeugt, selbst für anspruchsvolle Kategorie-übergreifende Fälle. MorphAny3D unterstützt weiterführende Anwendungen wie entkoppeltes Morphing und 3D-Styletransfer und kann auf andere SLAT-basierte Generative Modelle verallgemeinert werden. Projektseite: https://xiaokunsun.github.io/MorphAny3D.github.io/.
English
3D morphing remains challenging due to the difficulty of generating semantically consistent and temporally smooth deformations, especially across categories. We present MorphAny3D, a training-free framework that leverages Structured Latent (SLAT) representations for high-quality 3D morphing. Our key insight is that intelligently blending source and target SLAT features within the attention mechanisms of 3D generators naturally produces plausible morphing sequences. To this end, we introduce Morphing Cross-Attention (MCA), which fuses source and target information for structural coherence, and Temporal-Fused Self-Attention (TFSA), which enhances temporal consistency by incorporating features from preceding frames. An orientation correction strategy further mitigates the pose ambiguity within the morphing steps. Extensive experiments show that our method generates state-of-the-art morphing sequences, even for challenging cross-category cases. MorphAny3D further supports advanced applications such as decoupled morphing and 3D style transfer, and can be generalized to other SLAT-based generative models. Project page: https://xiaokunsun.github.io/MorphAny3D.github.io/.