RewardFlow: Generare Immagini Ottimizzando Ciò che Premi

Abstract

Presentiamo RewardFlow, un framework senza inversione che guida modelli preaddestrati di diffusione e flow-matching durante l'inferenza attraverso una dinamica di Langevin multi-ricompensa. RewardFlow unisce ricompense differenziabili complementari per l'allineamento semantico, la fedeltà percettiva, il grounding localizzato, la consistenza oggettuale e le preferenze umane, e introduce inoltre una ricompensa differenziabile basata su VQA che fornisce una supervisione semantica granulare attraverso il ragionamento linguaggio-visione. Per coordinare questi eterogenei obiettivi, progettiamo una politica adattiva prompt-aware che estrae primitive semantiche dall'istruzione, inferisce l'intento di modifica e modula dinamicamente i pesi delle ricompense e le dimensioni del passo durante tutto il campionamento. Su diverse benchmark di editing di immagini e generazione composizionale, RewardFlow fornisce una fedeltà di modifica e un allineamento composizionale allo stato dell'arte.

English

We introduce RewardFlow, an inversion-free framework that steers pretrained diffusion and flow-matching models at inference time through multi-reward Langevin dynamics. RewardFlow unifies complementary differentiable rewards for semantic alignment, perceptual fidelity, localized grounding, object consistency, and human preference, and further introduces a differentiable VQA-based reward that provides fine-grained semantic supervision through language-vision reasoning. To coordinate these heterogeneous objectives, we design a prompt-aware adaptive policy that extracts semantic primitives from the instruction, infers edit intent, and dynamically modulates reward weights and step sizes throughout sampling. Across several image editing and compositional generation benchmarks, RewardFlow delivers state-of-the-art edit fidelity and compositional alignment.

RewardFlow: Generare Immagini Ottimizzando Ciò che Premi

RewardFlow: Generate Images by Optimizing What You Reward

Abstract

Support