MorphAny3D: De Kracht van Gestructureerde Latente Ruimten Ontketenen voor 3D Morfen
MorphAny3D: Unleashing the Power of Structured Latent in 3D Morphing
January 1, 2026
Auteurs: Xiaokun Sun, Zeyu Cai, Hao Tang, Ying Tai, Jian Yang, Zhenyu Zhang
cs.AI
Samenvatting
3D-morphing blijft een uitdaging vanwege de moeilijkheid om semantisch consistente en temporeel vloeiende vervormingen te genereren, vooral tussen categorieën. Wij presenteren MorphAny3D, een trainingsvrij raamwerk dat gestructureerde latente (SLAT) representaties benut voor hoogwaardige 3D-morphing. Onze belangrijkste inzicht is dat het intelligent mengen van bron- en doel-SAT-kenmerken binnen de aandachtmechanismen van 3D-generators op natuurlijke wijze geloofwaardige morphing-sequenties produceert. Hiertoe introduceren we Morphing Cross-Attention (MCA), dat bron- en doelinformatie versmelt voor structurele samenhang, en Temporal-Fused Self-Attention (TFSA), dat de temporele consistentie verbetert door kenmerken van voorgaande frames te incorporeren. Een oriëntatiecorrectiestrategie vermindert verder de houdingsambiguïteit binnen de morphing-stappen. Uitgebreide experimenten tonen aan dat onze methode state-of-the-art morphing-sequenties genereert, zelfs voor uitdagende gevallen tussen categorieën. MorphAny3D ondersteunt verder geavanceerde toepassingen zoals ontkoppelde morphing en 3D-stijloverdracht, en kan worden gegeneraliseerd naar andere op SLAT gebaseerde generatieve modellen. Projectpagina: https://xiaokunsun.github.io/MorphAny3D.github.io/.
English
3D morphing remains challenging due to the difficulty of generating semantically consistent and temporally smooth deformations, especially across categories. We present MorphAny3D, a training-free framework that leverages Structured Latent (SLAT) representations for high-quality 3D morphing. Our key insight is that intelligently blending source and target SLAT features within the attention mechanisms of 3D generators naturally produces plausible morphing sequences. To this end, we introduce Morphing Cross-Attention (MCA), which fuses source and target information for structural coherence, and Temporal-Fused Self-Attention (TFSA), which enhances temporal consistency by incorporating features from preceding frames. An orientation correction strategy further mitigates the pose ambiguity within the morphing steps. Extensive experiments show that our method generates state-of-the-art morphing sequences, even for challenging cross-category cases. MorphAny3D further supports advanced applications such as decoupled morphing and 3D style transfer, and can be generalized to other SLAT-based generative models. Project page: https://xiaokunsun.github.io/MorphAny3D.github.io/.