ChatPaper.aiChatPaper

MorphAny3D : Libérer la puissance des espaces latents structurés pour le morphing 3D

MorphAny3D: Unleashing the Power of Structured Latent in 3D Morphing

January 1, 2026
papers.authors: Xiaokun Sun, Zeyu Cai, Hao Tang, Ying Tai, Jian Yang, Zhenyu Zhang
cs.AI

papers.abstract

La métamorphose 3D reste un défi en raison de la difficulté à générer des déformations sémantiquement cohérentes et temporellement fluides, particulièrement entre différentes catégories. Nous présentons MorphAny3D, un cadre d'apprentissage sans entraînement qui exploite les représentations SLAT (Structured Latent) pour une métamorphose 3D de haute qualité. Notre idée clé est qu'un mélange intelligent des caractéristiques SLAT source et cible au sein des mécanismes d'attention des générateurs 3D produit naturellement des séquences de métamorphose plausibles. À cette fin, nous introduisons l'attention croisée de métamorphose (MCA), qui fusionne les informations source et cible pour la cohérence structurelle, et l'attention auto-temporelle fusionnée (TFSA), qui améliore la cohérence temporelle en incorporant des caractéristiques des images précédentes. Une stratégie de correction d'orientation atténue en outre l'ambiguïté de pose dans les étapes de métamorphose. Des expériences approfondies montrent que notre méthode génère des séquences de métamorphose à la pointe de l'art, même pour des cas difficiles inter-catégories. MorphAny3D prend également en charge des applications avancées telles que la métamorphose découplée et le transfert de style 3D, et peut être généralisé à d'autres modèles génératifs basés sur SLAT. Page du projet : https://xiaokunsun.github.io/MorphAny3D.github.io/.
English
3D morphing remains challenging due to the difficulty of generating semantically consistent and temporally smooth deformations, especially across categories. We present MorphAny3D, a training-free framework that leverages Structured Latent (SLAT) representations for high-quality 3D morphing. Our key insight is that intelligently blending source and target SLAT features within the attention mechanisms of 3D generators naturally produces plausible morphing sequences. To this end, we introduce Morphing Cross-Attention (MCA), which fuses source and target information for structural coherence, and Temporal-Fused Self-Attention (TFSA), which enhances temporal consistency by incorporating features from preceding frames. An orientation correction strategy further mitigates the pose ambiguity within the morphing steps. Extensive experiments show that our method generates state-of-the-art morphing sequences, even for challenging cross-category cases. MorphAny3D further supports advanced applications such as decoupled morphing and 3D style transfer, and can be generalized to other SLAT-based generative models. Project page: https://xiaokunsun.github.io/MorphAny3D.github.io/.
PDF11January 6, 2026