ChatPaper.aiChatPaper

自己回帰的長期ビデオ生成のためのパスワイズテスト時補正

Pathwise Test-Time Correction for Autoregressive Long Video Generation

February 5, 2026
著者: Xunzhi Xiang, Zixuan Duan, Guiyu Zhang, Haiyu Zhang, Zhe Gao, Junta Wu, Shaofeng Zhang, Tengfei Wang, Qi Fan, Chunchao Guo
cs.AI

要旨

蒸留自己回帰拡散モデルはリアルタイムの短編動画合成を可能にするが、長系列生成において深刻な誤差蓄積に悩まされる。既存のテスト時最適化(TTO)手法は画像や短いクリップに対して有効であることが証明されているが、不安定な報酬地形と蒸留パラメータの過敏性により、長系列におけるドリフト軽減には失敗することが判明した。これらの制限を克服するため、我々は学習不要の代替手法であるテスト時補正(TTC)を提案する。具体的には、TTCは初期フレームを安定した参照アンカーとして利用し、サンプリング軌道上の中間確率的状態を較正する。大規模な実験により、本手法が様々な蒸留モデルとシームレスに統合し、30秒ベンチマークにおいてリソース集約的な学習ベース手法の品質を維持しながら、無視可能なオーバーヘッドで生成長を拡張できることが実証された。
English
Distilled autoregressive diffusion models facilitate real-time short video synthesis but suffer from severe error accumulation during long-sequence generation. While existing Test-Time Optimization (TTO) methods prove effective for images or short clips, we identify that they fail to mitigate drift in extended sequences due to unstable reward landscapes and the hypersensitivity of distilled parameters. To overcome these limitations, we introduce Test-Time Correction (TTC), a training-free alternative. Specifically, TTC utilizes the initial frame as a stable reference anchor to calibrate intermediate stochastic states along the sampling trajectory. Extensive experiments demonstrate that our method seamlessly integrates with various distilled models, extending generation lengths with negligible overhead while matching the quality of resource-intensive training-based methods on 30-second benchmarks.
PDF22February 7, 2026