ChatPaper.aiChatPaper

RewardFlow: Genereer Afbeeldingen door te Optimaliseren wat je Beloont

RewardFlow: Generate Images by Optimizing What You Reward

April 9, 2026
Auteurs: Onkar Susladkar, Dong-Hwan Jang, Tushar Prakash, Adheesh Juvekar, Vedant Shah, Ayush Barik, Nabeel Bashir, Muntasir Wahed, Ritish Shrirao, Ismini Lourentzou
cs.AI

Samenvatting

Wij introduceren RewardFlow, een inversievrij raamwerk dat vooraf getrainde diffusie- en flow-matchingmodellen tijdens de inferentie aanstuurt via multi-reward Langevin-dynamica. RewardFlow verenigt complementaire differentieerbare beloningen voor semantische uitlijning, perceptuele kwaliteit, gelokaliseerde verankering, objectconsistentie en menselijke voorkeur, en introduceert verder een differentieerbare op VQA gebaseerde beloning die fijnmazig semantisch toezicht verschaft door middel van taal-visie redenering. Om deze heterogene doelstellingen te coördineren, ontwerpen we een prompt-afhankelijk adaptief beleid dat semantische primitieven uit de instructie haalt, de bewerkingsintentie afleidt en de beloningsgewichten en stapgroottes gedurende de steekproefname dynamisch moduleert. Op verscheidene benchmarks voor beeldbewerking en compositionele generatie levert RewardFlow state-of-the-art bewerkingsnauwkeurigheid en compositionele uitlijning.
English
We introduce RewardFlow, an inversion-free framework that steers pretrained diffusion and flow-matching models at inference time through multi-reward Langevin dynamics. RewardFlow unifies complementary differentiable rewards for semantic alignment, perceptual fidelity, localized grounding, object consistency, and human preference, and further introduces a differentiable VQA-based reward that provides fine-grained semantic supervision through language-vision reasoning. To coordinate these heterogeneous objectives, we design a prompt-aware adaptive policy that extracts semantic primitives from the instruction, infers edit intent, and dynamically modulates reward weights and step sizes throughout sampling. Across several image editing and compositional generation benchmarks, RewardFlow delivers state-of-the-art edit fidelity and compositional alignment.
PDF32April 13, 2026