Resolução de Problemas Inversos com FLAIR

Resumo

Modelos generativos latentes baseados em fluxo, como o Stable Diffusion 3, são capazes de gerar imagens com qualidade notável, permitindo até mesmo a geração foto-realística de texto para imagem. Seu desempenho impressionante sugere que esses modelos também deveriam constituir priors poderosos para problemas de imagem inversa, mas essa abordagem ainda não alcançou fidelidade comparável. Existem vários obstáculos principais: (i) a codificação em um espaço latente de dimensão reduzida torna o mapeamento (direto) subjacente não linear; (ii) o termo de verossimilhança dos dados geralmente é intratável; e (iii) modelos generativos aprendidos têm dificuldade em recuperar modos de dados raros e atípicos durante a inferência. Apresentamos o FLAIR, uma nova estrutura variacional livre de treinamento que aproveita modelos generativos baseados em fluxo como prior para problemas inversos. Para isso, introduzimos um objetivo variacional para correspondência de fluxo que é agnóstico ao tipo de degradação e o combinamos com ajustes determinísticos de trajetória para recuperar modos atípicos. Para impor consistência exata com os dados observados, desacoplamos a otimização dos termos de fidelidade dos dados e regularização. Além disso, introduzimos um esquema de calibração dependente do tempo em que a força da regularização é modulada de acordo com estimativas de precisão off-line. Resultados em benchmarks padrão de imagem demonstram que o FLAIR supera consistentemente métodos existentes baseados em difusão e fluxo em termos de qualidade de reconstrução e diversidade de amostras.

English

Flow-based latent generative models such as Stable Diffusion 3 are able to generate images with remarkable quality, even enabling photorealistic text-to-image generation. Their impressive performance suggests that these models should also constitute powerful priors for inverse imaging problems, but that approach has not yet led to comparable fidelity. There are several key obstacles: (i) the encoding into a lower-dimensional latent space makes the underlying (forward) mapping non-linear; (ii) the data likelihood term is usually intractable; and (iii) learned generative models struggle to recover rare, atypical data modes during inference. We present FLAIR, a novel training free variational framework that leverages flow-based generative models as a prior for inverse problems. To that end, we introduce a variational objective for flow matching that is agnostic to the type of degradation, and combine it with deterministic trajectory adjustments to recover atypical modes. To enforce exact consistency with the observed data, we decouple the optimization of the data fidelity and regularization terms. Moreover, we introduce a time-dependent calibration scheme in which the strength of the regularization is modulated according to off-line accuracy estimates. Results on standard imaging benchmarks demonstrate that FLAIR consistently outperforms existing diffusion- and flow-based methods in terms of reconstruction quality and sample diversity.

Resolução de Problemas Inversos com FLAIR

Solving Inverse Problems with FLAIR

Resumo

Support