Animate-X:具有增强运动表示的通用角色图像动画Animate-X: Universal Character Image Animation with Enhanced Motion
Representation
角色图像动画,从参考图像和目标姿势序列生成高质量视频,在近年来取得了显著进展。然而,大多数现有方法仅适用于人物形象,通常在游戏和娱乐等行业常用的类人角色上泛化能力不佳。我们的深入分析表明,这种限制归因于它们对运动建模不足,无法理解驱动视频的运动模式,因此会将姿势序列严格施加到目标角色上。因此,本文提出了一种基于LDM的通用动画框架Aniamte-X,适用于各种角色类型(统称为X),包括类人角色。为增强运动表征,我们引入了姿势指示器,通过隐式和显式方式从驱动视频中捕获全面的运动模式。前者利用驱动视频的CLIP视觉特征提取其运动要点,如整体运动模式和运动之间的时间关系,后者通过提前模拟可能在推理过程中出现的输入,加强了LDM的泛化能力。此外,我们引入了一个新的动画类人基准(A^2Bench)来评估Animate-X在通用和广泛适用的动画图像上的性能。大量实验证明了Animate-X相对于最先进方法的优越性和有效性。