ChatPaper.aiChatPaper

MagicID: ID一貫性と動的保存を実現するハイブリッド選好最適化によるビデオカスタマイズ

MagicID: Hybrid Preference Optimization for ID-Consistent and Dynamic-Preserved Video Customization

March 16, 2025
著者: Hengjia Li, Lifan Jiang, Xi Xiao, Tianyang Wang, Hongwei Yi, Boxi Wu, Deng Cai
cs.AI

要旨

ビデオIDカスタマイズは、ユーザーの参照画像に基づいて一貫したIDを維持し、顕著なダイナミクスを示す高精細なビデオを生成することを目指しています。しかし、既存のアプローチでは、2つの主要な課題に直面しています。1つは、ビデオの長さが長くなるにつれてIDが劣化すること、もう1つは、主に静的な画像を用いた従来の自己再構成トレーニングに依存しているため、トレーニング中のダイナミクスが低下することです。これらの問題を解決するために、我々はMagicIDを導入しました。これは、ユーザーの好みに合わせたID一貫性とダイナミックなビデオ生成を直接促進する新しいフレームワークです。具体的には、従来の自己再構成に固執するのではなく、明示的なIDとダイナミックな報酬を持つペアワイズ選好ビデオデータを構築して選好学習を行うことを提案します。カスタマイズされた選好データの制約に対処するために、ハイブリッドサンプリング戦略を導入しました。このアプローチでは、まず参照画像から派生した静的なビデオを活用してIDの保存を優先し、次にFrontierベースのサンプリング方法を使用して生成されたビデオの動きの質を向上させます。これらのハイブリッド選好ペアを利用することで、モデルを最適化し、カスタマイズされた選好ペア間の報酬差に合わせます。広範な実験により、MagicIDが一貫したIDと自然なダイナミクスを成功裏に達成し、様々なメトリクスで既存の方法を凌駕することが示されました。
English
Video identity customization seeks to produce high-fidelity videos that maintain consistent identity and exhibit significant dynamics based on users' reference images. However, existing approaches face two key challenges: identity degradation over extended video length and reduced dynamics during training, primarily due to their reliance on traditional self-reconstruction training with static images. To address these issues, we introduce MagicID, a novel framework designed to directly promote the generation of identity-consistent and dynamically rich videos tailored to user preferences. Specifically, we propose constructing pairwise preference video data with explicit identity and dynamic rewards for preference learning, instead of sticking to the traditional self-reconstruction. To address the constraints of customized preference data, we introduce a hybrid sampling strategy. This approach first prioritizes identity preservation by leveraging static videos derived from reference images, then enhances dynamic motion quality in the generated videos using a Frontier-based sampling method. By utilizing these hybrid preference pairs, we optimize the model to align with the reward differences between pairs of customized preferences. Extensive experiments show that MagicID successfully achieves consistent identity and natural dynamics, surpassing existing methods across various metrics.

Summary

AI-Generated Summary

PDF52March 21, 2025