RewardFlow : Générer des images en optimisant ce que vous récompensez

Résumé

Nous présentons RewardFlow, un cadre sans inversion qui guide les modèles de diffusion et d'appariement de flux pré-entraînés lors de l'inférence via une dynamique de Langevin multi-récompenses. RewardFlow unifie des récompenses différentiables complémentaires pour l'alignement sémantique, la fidélité perceptuelle, l'ancrage localisé, la cohérence des objets et les préférences humaines, et introduit en outre une récompense différentiable basée sur le VQA qui fournit une supervision sémantique fine grâce au raisonnement langage-vision. Pour coordonner ces objectifs hétérogènes, nous concevons une politique adaptive sensible au prompt qui extrait des primitives sémantiques de l'instruction, infère l'intention d'édition et module dynamiquement les poids des récompenses et les tailles de pas tout au long de l'échantillonnage. Sur plusieurs benchmarks d'édition d'image et de génération compositionnelle, RewardFlow offre une fidélité d'édition et un alignement compositionnel à la pointe de l'état de l'art.

English

We introduce RewardFlow, an inversion-free framework that steers pretrained diffusion and flow-matching models at inference time through multi-reward Langevin dynamics. RewardFlow unifies complementary differentiable rewards for semantic alignment, perceptual fidelity, localized grounding, object consistency, and human preference, and further introduces a differentiable VQA-based reward that provides fine-grained semantic supervision through language-vision reasoning. To coordinate these heterogeneous objectives, we design a prompt-aware adaptive policy that extracts semantic primitives from the instruction, infers edit intent, and dynamically modulates reward weights and step sizes throughout sampling. Across several image editing and compositional generation benchmarks, RewardFlow delivers state-of-the-art edit fidelity and compositional alignment.

RewardFlow : Générer des images en optimisant ce que vous récompensez

RewardFlow: Generate Images by Optimizing What You Reward

Résumé

Support