Animate-X: Animazione di immagini di personaggi universali con rappresentazione del movimento migliorataAnimate-X: Universal Character Image Animation with Enhanced Motion
Representation
L'animazione di immagini di personaggi, che genera video di alta qualità da un'immagine di riferimento e una sequenza di pose target, ha visto progressi significativi negli ultimi anni. Tuttavia, la maggior parte dei metodi esistenti si applica solo a figure umane, che di solito non si generalizzano bene sui personaggi antropomorfi comunemente usati in settori come il gaming e l'intrattenimento. La nostra analisi approfondita suggerisce che questa limitazione sia dovuta alla loro modellazione insufficiente del movimento, che non riesce a comprendere il modello di movimento del video guida, imponendo quindi rigidamente una sequenza di pose al personaggio target. A tal fine, questo articolo propone Animate-X, un framework di animazione universale basato su LDM per vari tipi di personaggi (collettivamente chiamati X), inclusi i personaggi antropomorfi. Per migliorare la rappresentazione del movimento, introduciamo l'Indicatore di Pose, che cattura il modello di movimento completo dal video guida sia in modo implicito che esplicito. Il primo sfrutta le caratteristiche visive CLIP di un video guida per estrarre il suo senso del movimento, come il modello di movimento generale e le relazioni temporali tra i movimenti, mentre il secondo rafforza la generalizzazione di LDM simulando in anticipo possibili input che potrebbero sorgere durante l'inferenza. Inoltre, introduciamo un nuovo Benchmark Antropomorfo Animato (A^2Bench) per valutare le prestazioni di Animate-X su immagini di animazione universali e ampiamente applicabili. Estesi esperimenti dimostrano la superiorità e l'efficacia di Animate-X rispetto ai metodi all'avanguardia.