ChatPaper.aiChatPaper

RewardFlow: Generar imágenes optimizando lo que premias

RewardFlow: Generate Images by Optimizing What You Reward

April 9, 2026
Autores: Onkar Susladkar, Dong-Hwan Jang, Tushar Prakash, Adheesh Juvekar, Vedant Shah, Ayush Barik, Nabeel Bashir, Muntasir Wahed, Ritish Shrirao, Ismini Lourentzou
cs.AI

Resumen

Presentamos RewardFlow, un marco libre de inversión que guía modelos preentrenados de difusión y _flow-matching_ durante la inferencia mediante dinámicas de Langevin multi-recompensa. RewardFlow unifica recompensas diferenciables complementarias para la alineación semántica, la fidelidad perceptual, la fundamentación localizada, la consistencia de objetos y la preferencia humana, e introduce además una recompensa diferenciada basada en VQA que proporciona una supervisión semántica de grano fino mediante el razonamiento lenguaje-visión. Para coordinar estos objetivos heterogéneos, diseñamos una política adaptativa consciente del _prompt_ que extrae primitivas semánticas de la instrucción, infiere la intención de edición y modula dinámicamente los pesos de las recompensas y los tamaños de paso a lo largo del muestreo. En varios puntos de referencia de edición de imágenes y generación composicional, RewardFlow ofrece una fidelidad de edición y una alineación composicional de vanguardia.
English
We introduce RewardFlow, an inversion-free framework that steers pretrained diffusion and flow-matching models at inference time through multi-reward Langevin dynamics. RewardFlow unifies complementary differentiable rewards for semantic alignment, perceptual fidelity, localized grounding, object consistency, and human preference, and further introduces a differentiable VQA-based reward that provides fine-grained semantic supervision through language-vision reasoning. To coordinate these heterogeneous objectives, we design a prompt-aware adaptive policy that extracts semantic primitives from the instruction, infers edit intent, and dynamically modulates reward weights and step sizes throughout sampling. Across several image editing and compositional generation benchmarks, RewardFlow delivers state-of-the-art edit fidelity and compositional alignment.
PDF11April 11, 2026