자율 회귀적 장기 영상 생성을 위한 경로 기반 테스트 타임 보정
Pathwise Test-Time Correction for Autoregressive Long Video Generation
February 5, 2026
저자: Xunzhi Xiang, Zixuan Duan, Guiyu Zhang, Haiyu Zhang, Zhe Gao, Junta Wu, Shaofeng Zhang, Tengfei Wang, Qi Fan, Chunchao Guo
cs.AI
초록
증류된 자기회귀 확산 모델은 실시간 단영상 합성을 가능하게 하지만 장편 생성 시 심각한 오류 누적 문제를 겪습니다. 기존의 테스트 타임 최적화(TTO) 방법이 이미지나 단편 클립에는 효과적이지만, 불안정한 보상 환경과 증류 매개변수의 과민 반응으로 인해 장편 시퀀스에서의 표류 현상을 완화하지 못함을 확인했습니다. 이러한 한계를 극복하기 위해 우리는 훈련이 필요 없는 대안인 테스트 타임 보정(TTC)을 제안합니다. 구체적으로 TTC는 초기 프레임을 안정적인 기준 앵커로 활용하여 샘플링 경로를 따라가는 중간 확률적 상태를 보정합니다. 다양한 실험을 통해 우리의 방법이 여러 증류 모델과 원활하게 통합되어 최소한의 오버헤드로 생성 길이를 확장하면서도 30초 벤치마크에서 리소스 집약적인 훈련 기반 방법의 품질에 필적함을 입증했습니다.
English
Distilled autoregressive diffusion models facilitate real-time short video synthesis but suffer from severe error accumulation during long-sequence generation. While existing Test-Time Optimization (TTO) methods prove effective for images or short clips, we identify that they fail to mitigate drift in extended sequences due to unstable reward landscapes and the hypersensitivity of distilled parameters. To overcome these limitations, we introduce Test-Time Correction (TTC), a training-free alternative. Specifically, TTC utilizes the initial frame as a stable reference anchor to calibrate intermediate stochastic states along the sampling trajectory. Extensive experiments demonstrate that our method seamlessly integrates with various distilled models, extending generation lengths with negligible overhead while matching the quality of resource-intensive training-based methods on 30-second benchmarks.