ChatPaper.aiChatPaper

FlashPortrait:適応的潜在予測による6倍高速な無限ポートレートアニメーション

FlashPortrait: 6x Faster Infinite Portrait Animation with Adaptive Latent Prediction

December 18, 2025
著者: Shuyuan Tu, Yueming Pan, Yinming Huang, Xintong Han, Zhen Xing, Qi Dai, Kai Qiu, Chong Luo, Zuxuan Wu
cs.AI

要旨

現在の拡散ベースの長尺ポートレートアニメーション加速手法は、アイデンティティ(ID)一貫性の確保に課題を抱えている。本論文では、IDを保持した無限長の動画を合成可能なエンドツーエンドのビデオ拡散トランスフォーマーであるFlashPortraitを提案する。さらに、推論速度において最大6倍の加速を実現する。具体的には、FlashPortraitはまず、既製の抽出器を用いてIDに依存しない顔表情特徴を計算する。次に、正規化顔表情ブロックを導入し、顔特徴をそれぞれの平均と分散で正規化することで拡散潜在表現と整合させ、顔モデリングにおけるID安定性を向上させる。推論時には、動的スライディングウィンドウ方式と重複領域における重み付きブレンディングを採用し、長尺アニメーションにおける滑らかな遷移とID一貫性を保証する。各コンテキストウィンドウ内では、特定のタイムステップにおける潜在変動率と拡散層間の微分値大きさ比に基づき、現在のタイムステップでの高次潜在微分値を利用して将来のタイムステップの潜在表現を直接予測する。これにより、複数のノイズ除去ステップをスキップし、6倍の速度加速を達成する。ベンチマークを用いた実験により、FlashPortraitの質的・量的な有効性が示された。
English
Current diffusion-based acceleration methods for long-portrait animation struggle to ensure identity (ID) consistency. This paper presents FlashPortrait, an end-to-end video diffusion transformer capable of synthesizing ID-preserving, infinite-length videos while achieving up to 6x acceleration in inference speed. In particular, FlashPortrait begins by computing the identity-agnostic facial expression features with an off-the-shelf extractor. It then introduces a Normalized Facial Expression Block to align facial features with diffusion latents by normalizing them with their respective means and variances, thereby improving identity stability in facial modeling. During inference, FlashPortrait adopts a dynamic sliding-window scheme with weighted blending in overlapping areas, ensuring smooth transitions and ID consistency in long animations. In each context window, based on the latent variation rate at particular timesteps and the derivative magnitude ratio among diffusion layers, FlashPortrait utilizes higher-order latent derivatives at the current timestep to directly predict latents at future timesteps, thereby skipping several denoising steps and achieving 6x speed acceleration. Experiments on benchmarks show the effectiveness of FlashPortrait both qualitatively and quantitatively.
PDF92December 20, 2025