ChatPaper.aiChatPaper

Image Conductor: インタラクティブなビデオ合成のための精密制御

Image Conductor: Precision Control for Interactive Video Synthesis

June 21, 2024
著者: Yaowei Li, Xintao Wang, Zhaoyang Zhang, Zhouxia Wang, Ziyang Yuan, Liangbin Xie, Yuexian Zou, Ying Shan
cs.AI

要旨

映画制作やアニメーション制作では、カメラの遷移やオブジェクトの動きを調整するために高度な技術が必要であり、通常は労力を要する実世界での撮影が行われます。ビデオ生成のための生成AIが進歩しているにもかかわらず、インタラクティブなビデオアセット生成において動きを精密に制御することは依然として困難です。そこで我々は、単一の画像からビデオアセットを生成するために、カメラの遷移やオブジェクトの動きを精密に制御する方法である「Image Conductor」を提案します。カメラLoRA重みとオブジェクトLoRA重みを用いて、異なるカメラとオブジェクトの動きを分離するための洗練されたトレーニング戦略を提案します。さらに、不適切な軌道から生じる映画的なバリエーションに対処するため、推論中にカメラフリーガイダンス技術を導入し、カメラの遷移を排除しながらオブジェクトの動きを強化します。また、トレーニングのための軌道指向のビデオモーションデータキュレーションパイプラインを開発します。定量的および定性的な実験により、画像から動きを制御可能なビデオを生成する際の精度と細かい制御が実証され、インタラクティブなビデオ合成の実用的な応用が進展します。プロジェクトのウェブページはhttps://liyaowei-stu.github.io/project/ImageConductor/で公開されています。
English
Filmmaking and animation production often require sophisticated techniques for coordinating camera transitions and object movements, typically involving labor-intensive real-world capturing. Despite advancements in generative AI for video creation, achieving precise control over motion for interactive video asset generation remains challenging. To this end, we propose Image Conductor, a method for precise control of camera transitions and object movements to generate video assets from a single image. An well-cultivated training strategy is proposed to separate distinct camera and object motion by camera LoRA weights and object LoRA weights. To further address cinematographic variations from ill-posed trajectories, we introduce a camera-free guidance technique during inference, enhancing object movements while eliminating camera transitions. Additionally, we develop a trajectory-oriented video motion data curation pipeline for training. Quantitative and qualitative experiments demonstrate our method's precision and fine-grained control in generating motion-controllable videos from images, advancing the practical application of interactive video synthesis. Project webpage available at https://liyaowei-stu.github.io/project/ImageConductor/

Summary

AI-Generated Summary

PDF93November 29, 2024