Refocalização Generativa: Controle Flexível de Desfoque a partir de uma Única Imagem
Generative Refocusing: Flexible Defocus Control from a Single Image
December 18, 2025
Autores: Chun-Wei Tuan Mu, Jia-Bin Huang, Yu-Lun Liu
cs.AI
Resumo
O controle de profundidade de campo é essencial na fotografia, mas obter o foco perfeito geralmente requer várias tentativas ou equipamentos especiais. O refocamento a partir de uma única imagem continua sendo um desafio, pois envolve recuperar conteúdo nítido e criar um bokeh realista. Os métodos atuais apresentam limitações significativas: exigem imagens totalmente em foco como entrada, dependem de dados sintéticos de simuladores e têm controle limitado sobre a abertura. Apresentamos o Generative Refocusing, um processo em duas etapas que utiliza o DeblurNet para recuperar imagens totalmente em foco a partir de várias entradas e o BokehNet para criar bokeh controlável. Nossa principal inovação é o treinamento semissupervisionado, que combina dados sintéticos emparelhados com imagens reais de bokeh não emparelhadas, utilizando metadados EXIF para capturar características ópticas reais além do que os simuladores podem fornecer. Nossos experimentos demonstram desempenho superior em benchmarks de desembaçamento por desfoque, síntese de bokeh e refocamento. Adicionalmente, nosso Generative Refocusing permite ajustes guiados por texto e formas de abertura personalizadas.
English
Depth-of-field control is essential in photography, but getting the perfect focus often takes several tries or special equipment. Single-image refocusing is still difficult. It involves recovering sharp content and creating realistic bokeh. Current methods have significant drawbacks. They need all-in-focus inputs, depend on synthetic data from simulators, and have limited control over aperture. We introduce Generative Refocusing, a two-step process that uses DeblurNet to recover all-in-focus images from various inputs and BokehNet for creating controllable bokeh. Our main innovation is semi-supervised training. This method combines synthetic paired data with unpaired real bokeh images, using EXIF metadata to capture real optical characteristics beyond what simulators can provide. Our experiments show we achieve top performance in defocus deblurring, bokeh synthesis, and refocusing benchmarks. Additionally, our Generative Refocusing allows text-guided adjustments and custom aperture shapes.