Lernen des Refokussierens mit Videodiffusionsmodellen
Learning to Refocus with Video Diffusion Models
December 22, 2025
papers.authors: SaiKiran Tedla, Zhoutong Zhang, Xuaner Zhang, Shumian Xin
cs.AI
papers.abstract
Fokus ist ein Grundpfeiler der Fotografie, doch Autofokus-Systeme erfassen oft nicht das beabsichtigte Motiv, und Nutzer wünschen sich häufig, den Fokus nach der Aufnahme anzupassen. Wir stellen eine neuartige Methode für realistisches Nachschärfen mittels Video-Diffusionsmodellen vor. Aus einem einzigen unscharfen Bild erzeugt unser Ansatz einen wahrnehmungsgetreu akkuraten Fokus-Stapel, der als Videosequenz dargestellt wird. Dies ermöglicht interaktives Nachschärfen und eröffnet eine Reihe nachgelagerter Anwendungen. Zur Unterstützung dieser Arbeit und zukünftiger Forschung veröffentlichen wir einen umfangreichen Fokus-Stapel-Datensatz, der unter verschiedenen realen Smartphone-Bedingungen aufgenommen wurde. Unsere Methode übertrifft bestehende Ansätze durchweg sowohl in der wahrgenommenen Qualität als auch in der Robustheit in anspruchsvollen Szenarien und ebnet so den Weg für erweiterte Fokus-Bearbeitungsmöglichkeiten in der Alltagsfotografie. Code und Daten sind verfügbar unter www.learn2refocus.github.io.
English
Focus is a cornerstone of photography, yet autofocus systems often fail to capture the intended subject, and users frequently wish to adjust focus after capture. We introduce a novel method for realistic post-capture refocusing using video diffusion models. From a single defocused image, our approach generates a perceptually accurate focal stack, represented as a video sequence, enabling interactive refocusing and unlocking a range of downstream applications. We release a large-scale focal stack dataset acquired under diverse real-world smartphone conditions to support this work and future research. Our method consistently outperforms existing approaches in both perceptual quality and robustness across challenging scenarios, paving the way for more advanced focus-editing capabilities in everyday photography. Code and data are available at www.learn2refocus.github.io