ChatPaper.aiChatPaper

MorphAny3D:構造化潜在空間の力を解き放つ3Dモーフィング

MorphAny3D: Unleashing the Power of Structured Latent in 3D Morphing

January 1, 2026
著者: Xiaokun Sun, Zeyu Cai, Hao Tang, Ying Tai, Jian Yang, Zhenyu Zhang
cs.AI

要旨

3Dモーフィングは、特にカテゴリ間において意味的に一貫性があり時間的に滑らかな変形を生成することが困難であるため、依然として課題となっている。本研究では、高品質な3Dモーフィングのためのトレーニング不要のフレームワークであるMorphAny3Dを提案する。本フレームワークは、構造化潜在表現を利用する。我々の重要な知見は、3D生成モデルのアテンション機構内でソースとターゲットのSLAT特徴を知的にブレンドすることが、自然で説得力のあるモーフィングシーケンスを生成するという点である。この目的のために、構造的一貫性のためにソースとターゲットの情報を融合するMorphing Cross-Attentionと、前フレームの特徴を組み込むことで時間的一貫性を強化するTemporal-Fused Self-Attentionを導入する。さらに、姿勢補正戦略により、モーフィングステップ内の姿勢の曖昧さを軽減する。大規模な実験により、本手法が、困難なカテゴリ間の場合であっても、最先端のモーフィングシーケンスを生成することを示す。MorphAny3Dは、分離モーフィングや3Dスタイル転送などの高度な応用をさらにサポートし、他のSLATベースの生成モデルへ一般化することが可能である。プロジェクトページ: https://xiaokunsun.github.io/MorphAny3D.github.io/
English
3D morphing remains challenging due to the difficulty of generating semantically consistent and temporally smooth deformations, especially across categories. We present MorphAny3D, a training-free framework that leverages Structured Latent (SLAT) representations for high-quality 3D morphing. Our key insight is that intelligently blending source and target SLAT features within the attention mechanisms of 3D generators naturally produces plausible morphing sequences. To this end, we introduce Morphing Cross-Attention (MCA), which fuses source and target information for structural coherence, and Temporal-Fused Self-Attention (TFSA), which enhances temporal consistency by incorporating features from preceding frames. An orientation correction strategy further mitigates the pose ambiguity within the morphing steps. Extensive experiments show that our method generates state-of-the-art morphing sequences, even for challenging cross-category cases. MorphAny3D further supports advanced applications such as decoupled morphing and 3D style transfer, and can be generalized to other SLAT-based generative models. Project page: https://xiaokunsun.github.io/MorphAny3D.github.io/.
PDF11January 6, 2026