Animate-X: Animação de Imagens de Personagens Universal com Representação Aprimorada de MovimentoAnimate-X: Universal Character Image Animation with Enhanced Motion
Representation
A animação de imagem de personagem, que gera vídeos de alta qualidade a partir de uma imagem de referência e uma sequência de poses-alvo, tem visto um progresso significativo nos últimos anos. No entanto, a maioria dos métodos existentes se aplica apenas a figuras humanas, o que geralmente não se generaliza bem em personagens antropomórficos comumente usados em indústrias como jogos e entretenimento. Nossa análise aprofundada sugere que essa limitação se deve principalmente a uma modelagem de movimento insuficiente, que não consegue compreender o padrão de movimento do vídeo de referência, impondo rigidamente uma sequência de poses no personagem-alvo. Para resolver isso, este artigo propõe Animate-X, um framework de animação universal baseado em LDM para vários tipos de personagens (coletivamente nomeados X), incluindo personagens antropomórficos. Para aprimorar a representação de movimento, introduzimos o Indicador de Pose, que captura o padrão de movimento abrangente do vídeo de referência de maneira implícita e explícita. O primeiro utiliza características visuais CLIP de um vídeo de referência para extrair sua essência de movimento, como o padrão geral de movimento e as relações temporais entre os movimentos, enquanto o segundo fortalece a generalização de LDM ao simular possíveis entradas antecipadamente que podem surgir durante a inferência. Além disso, introduzimos um novo Benchmark de Antropomorfização Animada (A^2Bench) para avaliar o desempenho do Animate-X em imagens de animação universais e amplamente aplicáveis. Experimentos extensivos demonstram a superioridade e eficácia do Animate-X em comparação com os métodos de ponta.