Animate-X: Universele karakterafbeeldingsanimatie met verbeterde bewegingsrepresentatieAnimate-X: Universal Character Image Animation with Enhanced Motion
Representation
Karakterbeeldanimatie, die hoogwaardige video's genereert vanuit een referentiebeeld en een doelhoudingreeks, heeft de afgelopen jaren aanzienlijke vooruitgang geboekt. De meeste bestaande methoden zijn echter alleen van toepassing op menselijke figuren, die meestal niet goed generaliseren naar antropomorfe karakters die veel worden gebruikt in sectoren zoals gaming en entertainment. Onze diepgaande analyse suggereert dat deze beperking kan worden toegeschreven aan hun ontoereikende modellering van beweging, die niet in staat is om het bewegingspatroon van de sturende video te begrijpen en daarom star een houdingreeks oplegt aan het doelkarakter. Daarom stelt dit artikel Animate-X voor, een universeel animatiekader gebaseerd op LDM voor verschillende karaktertypen (gezamenlijk aangeduid als X), inclusief antropomorfe karakters. Om de bewegingsrepresentatie te verbeteren, introduceren we de Pose Indicator, die een uitgebreid bewegingspatroon van de sturende video vastlegt op zowel impliciete als expliciete wijze. De eerste maakt gebruik van CLIP visuele kenmerken van een sturende video om de essentie van de beweging te extraheren, zoals het algemene bewegingspatroon en de temporele relaties tussen bewegingen, terwijl de laatste de generalisatie van LDM versterkt door mogelijke invoer vooraf te simuleren die zich tijdens inferentie kunnen voordoen. Bovendien introduceren we een nieuwe Geanimeerde Antropomorfe Benchmark (A^2Bench) om de prestaties van Animate-X op universele en breed toepasbare animatiebeelden te evalueren. Uitgebreide experimenten tonen de superioriteit en effectiviteit van Animate-X aan in vergelijking met state-of-the-art methoden.