Rifocalizzazione Generativa: Controllo Flessibile della Defocalizzazione da una Singola Immagine
Generative Refocusing: Flexible Defocus Control from a Single Image
December 18, 2025
Autori: Chun-Wei Tuan Mu, Jia-Bin Huang, Yu-Lun Liu
cs.AI
Abstract
Il controllo della profondità di campo è essenziale in fotografia, ma ottenere la messa a fuoco perfetta richiede spesso diversi tentativi o attrezzature speciali. La rifocalizzazione su singola immagine rimane difficile. Essa implica il recupero di contenuti nitidi e la creazione di un bokeh realistico. I metodi attuali presentano notevoli inconvenienti: richiedono input a fuoco su tutto il campo, dipendono da dati sintetici di simulatori e offrono un controllo limitato sull'apertura. Introduciamo la Rifocalizzazione Generativa, un processo in due fasi che utilizza DeblurNet per recuperare immagini a fuoco totale da vari input e BokehNet per creare un bokeh controllabile. La nostra innovazione principale è l'addestramento semi-supervisionato. Questo metodo combina dati accoppiati sintetici con immagini reali di bokeh non accoppiate, utilizzando i metadati EXIF per catturare caratteristiche ottiche reali che vanno oltre ciò che i simulatori possono fornire. I nostri esperimenti dimostrano prestazioni eccellenti nei benchmark di deblurring da defocus, sintesi del bokeh e rifocalizzazione. Inoltre, la nostra Rifocalizzazione Generativa consente regolazioni guidate da testo e forme personalizzate dell'apertura.
English
Depth-of-field control is essential in photography, but getting the perfect focus often takes several tries or special equipment. Single-image refocusing is still difficult. It involves recovering sharp content and creating realistic bokeh. Current methods have significant drawbacks. They need all-in-focus inputs, depend on synthetic data from simulators, and have limited control over aperture. We introduce Generative Refocusing, a two-step process that uses DeblurNet to recover all-in-focus images from various inputs and BokehNet for creating controllable bokeh. Our main innovation is semi-supervised training. This method combines synthetic paired data with unpaired real bokeh images, using EXIF metadata to capture real optical characteristics beyond what simulators can provide. Our experiments show we achieve top performance in defocus deblurring, bokeh synthesis, and refocusing benchmarks. Additionally, our Generative Refocusing allows text-guided adjustments and custom aperture shapes.