FlowSlider: Бестренировочное непрерывное редактирование изображений посредством разложения по критериям точности и управляемости
FlowSlider: Training-Free Continuous Image Editing via Fidelity-Steering Decomposition
April 2, 2026
Авторы: Taichi Endo, Guoqing Hao, Kazuhiko Sumi
cs.AI
Аннотация
Непрерывное редактирование изображений ставит целью обеспечить регуляторный контроль силы редактирования при сохранении точности воспроизведения исходного изображения и согласованности направления изменений. Существующие методы на основе машинного обучения, как правило, опираются на вспомогательные модули, обученные с использованием синтетических данных или косвенного контроля. Это влечет за собой дополнительные вычислительные затраты на обучение и привязывает поведение регулятора к распределению обучающих данных, что может снижать надежность при сдвигах распределения в редактировании или доменах. Мы предлагаем FlowSlider — беcпост-тренинговый метод непрерывного редактирования в Rectified Flow, не требующий дополнительного обучения. FlowSlider декомпозирует обновление FlowEdit на (i) член точности, выступающий в роли стабилизатора с условием на источник, который сохраняет идентичность и структуру, и (ii) член управления, направляющий семантический переход к целевому редактированию. Геометрический анализ и эмпирические измерения показывают, что эти компоненты приблизительно ортогональны, что позволяет осуществлять стабильный контроль силы путем масштабирования только члена управления при неизменном члене точности. В результате FlowSlider обеспечивает плавный и надежный контроль без пост-тренинга, повышая качество непрерывного редактирования в разнообразных задачах.
English
Continuous image editing aims to provide slider-style control of edit strength while preserving source-image fidelity and maintaining a consistent edit direction. Existing learning-based slider methods typically rely on auxiliary modules trained with synthetic or proxy supervision. This introduces additional training overhead and couples slider behavior to the training distribution, which can reduce reliability under distribution shifts in edits or domains. We propose FlowSlider, a training-free method for continuous editing in Rectified Flow that requires no post-training. FlowSlider decomposes FlowEdit's update into (i) a fidelity term, which acts as a source-conditioned stabilizer that preserves identity and structure, and (ii) a steering term that drives semantic transition toward the target edit. Geometric analysis and empirical measurements show that these terms are approximately orthogonal, enabling stable strength control by scaling only the steering term while keeping the fidelity term unchanged. As a result, FlowSlider provides smooth and reliable control without post-training, improving continuous editing quality across diverse tasks.