WorldCache : Accélération gratuite des modèles du monde par mise en cache hétérogène de jetons

Résumé

Les modèles du monde basés sur la diffusion ont montré un fort potentiel pour la simulation unifiée de l'environnement, mais le débruitage itératif reste trop coûteux pour une utilisation interactive et des simulations à long terme. Bien que la mise en cache des caractéristiques puisse accélérer l'inférence sans entraînement, nous constatons que les politiques conçues pour une diffusion unimodale se transfèrent mal aux modèles du monde en raison de deux obstacles spécifiques : l'hétérogénéité des tokens due au couplage multimodal et à la variation spatiale, et la dynamique temporelle non uniforme où un petit ensemble de tokens difficiles entraîne la croissance des erreurs, rendant le saut uniforme soit instable, soit trop conservateur. Nous proposons WorldCache, un cadre de mise en cache adapté aux modèles du monde par diffusion. Nous introduisons la Prédiction Hétérogène de Tokens Guidée par la Courbure, qui utilise un score de courbure fondé sur la physique pour estimer la prévisibilité des tokens et applique un prédicteur amorti guidé par Hermite pour les tokens chaotiques présentant des changements de direction abrupts. Nous concevons également un Saut Adaptatif Prioritariant le Chaos, qui accumule un signal de dérive adimensionnel normalisé par la courbure et ne recalcule que lorsque les tokens goulots d'étranglement commencent à dériver. Les expériences sur les modèles du monde par diffusion montrent que WorldCache offre des accélérations de bout en bout allant jusqu'à 3,7 fois tout en maintenant 98 % de la qualité des simulations, démontrant les avantages considérables et la praticabilité de WorldCache dans des scénarios à ressources limitées. Notre code est disponible sur https://github.com/FofGofx/WorldCache.

English

Diffusion-based world models have shown strong potential for unified world simulation, but the iterative denoising remains too costly for interactive use and long-horizon rollouts. While feature caching can accelerate inference without training, we find that policies designed for single-modal diffusion transfer poorly to world models due to two world-model-specific obstacles: token heterogeneity from multi-modal coupling and spatial variation, and non-uniform temporal dynamics where a small set of hard tokens drives error growth, making uniform skipping either unstable or overly conservative. We propose WorldCache, a caching framework tailored to diffusion world models. We introduce Curvature-guided Heterogeneous Token Prediction, which uses a physics-grounded curvature score to estimate token predictability and applies a Hermite-guided damped predictor for chaotic tokens with abrupt direction changes. We also design Chaotic-prioritized Adaptive Skipping, which accumulates a curvature-normalized, dimensionless drift signal and recomputes only when bottleneck tokens begin to drift. Experiments on diffusion world models show that WorldCache delivers up to 3.7times end-to-end speedups while maintaining 98\% rollout quality, demonstrating the vast advantages and practicality of WorldCache in resource-constrained scenarios. Our code is released in https://github.com/FofGofx/WorldCache.

WorldCache : Accélération gratuite des modèles du monde par mise en cache hétérogène de jetons

WorldCache: Accelerating World Models for Free via Heterogeneous Token Caching

Résumé

Support