ChatPaper.aiChatPaper

Aprendiendo a Reenfocar con Modelos de Difusión de Video

Learning to Refocus with Video Diffusion Models

December 22, 2025
Autores: SaiKiran Tedla, Zhoutong Zhang, Xuaner Zhang, Shumian Xin
cs.AI

Resumen

El enfoque es un pilar fundamental de la fotografía, sin embargo, los sistemas de enfoque automático a menudo fallan al capturar el sujeto deseado, y los usuarios frecuentemente desean ajustar el enfoque después de la captura. Presentamos un método novedoso para el reenfoque realista posterior a la captura utilizando modelos de difusión de video. A partir de una única imagen desenfocada, nuestro enfoque genera una pila de enfoque perceptualmente precisa, representada como una secuencia de video, lo que permite un reenfoque interactivo y desbloquea una gama de aplicaciones posteriores. Publicamos un extenso conjunto de datos de pilas de enfoque adquirido en diversas condiciones del mundo real con smartphones para respaldar este trabajo y futuras investigaciones. Nuestro método supera consistentemente a los enfoques existentes tanto en calidad perceptual como en robustez en escenarios desafiantes, allanando el camino para capacidades de edición de enfoque más avanzadas en la fotografía cotidiana. El código y los datos están disponibles en www.learn2refocus.github.io.
English
Focus is a cornerstone of photography, yet autofocus systems often fail to capture the intended subject, and users frequently wish to adjust focus after capture. We introduce a novel method for realistic post-capture refocusing using video diffusion models. From a single defocused image, our approach generates a perceptually accurate focal stack, represented as a video sequence, enabling interactive refocusing and unlocking a range of downstream applications. We release a large-scale focal stack dataset acquired under diverse real-world smartphone conditions to support this work and future research. Our method consistently outperforms existing approaches in both perceptual quality and robustness across challenging scenarios, paving the way for more advanced focus-editing capabilities in everyday photography. Code and data are available at www.learn2refocus.github.io
PDF01December 25, 2025