ReCapture: Generative Videokamera-Steuerungen für benutzerbereitgestellte Videos mittels Maskierter Video-FeinabstimmungReCapture: Generative Video Camera Controls for User-Provided Videos
using Masked Video Fine-Tuning
Kürzlich haben Durchbrüche in der Videomodellierung die Erzeugung kontrollierbarer Kameratrajektorien in generierten Videos ermöglicht. Diese Methoden können jedoch nicht direkt auf benutzerbereitgestellte Videos angewendet werden, die nicht von einem Videomodell erzeugt wurden. In diesem Artikel präsentieren wir ReCapture, eine Methode zur Erzeugung neuer Videos mit neuartigen Kameratrajektorien aus einem einzigen benutzerbereitgestellten Video. Unsere Methode ermöglicht es, das Referenzvideo mit all seinen bestehenden Szenenbewegungen aus völlig unterschiedlichen Blickwinkeln und mit kinematografischer Kamerabewegung neu zu generieren. Bemerkenswerterweise können wir mit unserer Methode auch Teile der Szene plausibel rekonstruieren, die im Referenzvideo nicht sichtbar waren. Unsere Methode funktioniert, indem (1) ein verrauschtes Ankervideo mit einer neuen Kameratrajektorie mithilfe von Multiview-Diffusionsmodellen oder tiefenbasiertem Point-Cloud-Rendering erzeugt wird und dann (2) das Ankervideo mithilfe unserer vorgeschlagenen Masked-Video-Fine-Tuning-Technik in ein sauberes und zeitlich konsistentes Video mit neuem Blickwinkel regeneriert wird.