ChatPaper.aiChatPaper

Wie Tiere tanzen (wenn niemand hinsieht)

How Animals Dance (When You're Not Looking)

May 29, 2025
Autoren: Xiaojuan Wang, Aleksander Holynski, Brian Curless, Ira Kemelmacher, Steve Seitz
cs.AI

Zusammenfassung

Wir präsentieren ein Keyframe-basiertes Framework zur Erzeugung von musik-synchronisierten, choreografiebewussten Tier-Tanzvideos. Ausgehend von wenigen Keyframes, die unterschiedliche Tierposen darstellen – erzeugt durch Text-zu-Bild-Prompting oder GPT-4o – formulieren wir die Tanzsynthese als ein Graph-Optimierungsproblem: Finde die optimale Keyframe-Struktur, die ein vorgegebenes Choreografie-Muster von Beats erfüllt, das automatisch aus einem Referenztanzvideo geschätzt werden kann. Wir führen zudem einen Ansatz zur Erzeugung gespiegelter Posendarstellungen ein, der essenziell ist, um Symmetrie im Tanz zu erfassen. Zwischenframes werden mithilfe eines Video-Diffusionsmodells synthetisiert. Mit nur sechs Eingabe-Keyframes kann unsere Methode bis zu 30 Sekunden lange Tanzvideos für eine Vielzahl von Tieren und Musikstücken erzeugen.
English
We present a keyframe-based framework for generating music-synchronized, choreography aware animal dance videos. Starting from a few keyframes representing distinct animal poses -- generated via text-to-image prompting or GPT-4o -- we formulate dance synthesis as a graph optimization problem: find the optimal keyframe structure that satisfies a specified choreography pattern of beats, which can be automatically estimated from a reference dance video. We also introduce an approach for mirrored pose image generation, essential for capturing symmetry in dance. In-between frames are synthesized using an video diffusion model. With as few as six input keyframes, our method can produce up to 30 second dance videos across a wide range of animals and music tracks.

Summary

AI-Generated Summary

PDF42May 30, 2025