ChatPaper.aiChatPaper

WorldCache: 加速ビデオ世界モデルのためのコンテンツ認識キャッシング

WorldCache: Content-Aware Caching for Accelerated Video World Models

March 23, 2026
著者: Umair Nawaz, Ahmed Heakl, Ufaq Khan, Abdelrahman Shaker, Salman Khan, Fahad Shahbaz Khan
cs.AI

要旨

Diffusion Transformer(DiT)は高精細なビデオ世界モデルを実現するが、逐次的なノイズ除去と高コストな時空間アテンションにより計算コストが高い。訓練不要な特徴キャッシングは、ノイズ除去ステップ間で中間アクティベーションを再利用することで推論を高速化する。しかし、既存手法の多くは、大域的ドリフトが小さい場合にキャッシュされた特徴を静的なスナップショットとして再利用するというゼロ次ホールド仮定に依存している。これにより、動的シーンではゴーストアーティファクト、ぼやけ、動きの不整合が生じやすい。本研究では、特徴を「いつ」「どのように」再利用するかを両面から改善する、知覚制約付き動的キャッシングフレームワーク「WorldCache」を提案する。WorldCacheは、動き適応型閾値、顕著性重み付きドリフト推定、ブレンディングとワーピングによる最適近似、拡散ステップ間での位相認識型閾値スケジューリングを導入する。これらを統合したアプローチにより、再訓練なしで適応的かつ動きに一貫した特徴再利用を実現する。PAI-Benchで評価したCosmos-Predict2.5-2Bにおいて、WorldCacheはベースライン品質の99.4%を維持しつつ2.3倍の推論高速化を達成し、従来の訓練不要キャッシング手法を大幅に上回る。コードはhttps://umair1221.github.io/World-Cache/{World-Cache}で公開されている。
English
Diffusion Transformers (DiTs) power high-fidelity video world models but remain computationally expensive due to sequential denoising and costly spatio-temporal attention. Training-free feature caching accelerates inference by reusing intermediate activations across denoising steps; however, existing methods largely rely on a Zero-Order Hold assumption i.e., reusing cached features as static snapshots when global drift is small. This often leads to ghosting artifacts, blur, and motion inconsistencies in dynamic scenes. We propose WorldCache, a Perception-Constrained Dynamical Caching framework that improves both when and how to reuse features. WorldCache introduces motion-adaptive thresholds, saliency-weighted drift estimation, optimal approximation via blending and warping, and phase-aware threshold scheduling across diffusion steps. Our cohesive approach enables adaptive, motion-consistent feature reuse without retraining. On Cosmos-Predict2.5-2B evaluated on PAI-Bench, WorldCache achieves 2.3times inference speedup while preserving 99.4\% of baseline quality, substantially outperforming prior training-free caching approaches. Our code can be accessed on https://umair1221.github.io/World-Cache/{World-Cache}.
PDF31March 25, 2026