MorphAny3D: Liberando el Poder del Espacio Latente Estructurado en el Morfado 3D
MorphAny3D: Unleashing the Power of Structured Latent in 3D Morphing
January 1, 2026
Autores: Xiaokun Sun, Zeyu Cai, Hao Tang, Ying Tai, Jian Yang, Zhenyu Zhang
cs.AI
Resumen
La morfología 3D sigue siendo un desafío debido a la dificultad de generar deformaciones semánticamente consistentes y temporalmente suaves, especialmente entre categorías. Presentamos MorphAny3D, un marco de trabajo que no requiere entrenamiento y aprovecha las representaciones de Latentes Estructurados (SLAT) para una morfología 3D de alta calidad. Nuestra idea clave es que la combinación inteligente de características SLAT de origen y destino dentro de los mecanismos de atención de los generadores 3D produce naturalmente secuencias de morphing plausibles. Para ello, introducimos la Atención Cruzada de Morphing (MCA), que fusiona información de origen y destino para lograr coherencia estructural, y la Auto-Atención de Fusión Temporal (TFSA), que mejora la consistencia temporal incorporando características de fotogramas anteriores. Una estrategia de corrección de orientación mitiga además la ambigüedad de pose dentro de los pasos de morphing. Experimentos exhaustivos muestran que nuestro método genera secuencias de morphing de vanguardia, incluso para casos desafiantes entre categorías. MorphAny3D admite además aplicaciones avanzadas como morphing desacoplado y transferencia de estilo 3D, y puede generalizarse a otros modelos generativos basados en SLAT. Página del proyecto: https://xiaokunsun.github.io/MorphAny3D.github.io/.
English
3D morphing remains challenging due to the difficulty of generating semantically consistent and temporally smooth deformations, especially across categories. We present MorphAny3D, a training-free framework that leverages Structured Latent (SLAT) representations for high-quality 3D morphing. Our key insight is that intelligently blending source and target SLAT features within the attention mechanisms of 3D generators naturally produces plausible morphing sequences. To this end, we introduce Morphing Cross-Attention (MCA), which fuses source and target information for structural coherence, and Temporal-Fused Self-Attention (TFSA), which enhances temporal consistency by incorporating features from preceding frames. An orientation correction strategy further mitigates the pose ambiguity within the morphing steps. Extensive experiments show that our method generates state-of-the-art morphing sequences, even for challenging cross-category cases. MorphAny3D further supports advanced applications such as decoupled morphing and 3D style transfer, and can be generalized to other SLAT-based generative models. Project page: https://xiaokunsun.github.io/MorphAny3D.github.io/.