Следуйте среднему: потоковое согласование с эталоном

Аннотация

Существующие подходы к управляемой генерации обычно основаны на тонкой настройке, вспомогательных сетях или поиске во время тестирования. Мы показываем, что согласование потоков допускает другой интерфейс управления: адаптацию через примеры. Для детерминированных интерполянтов поле скорости определяется исключительно условным средним конечных точек; сдвиг этого среднего сдвигает сам поток. Это дает простой принцип управляемой генерации: направлять предварительно обученную модель, изменяя эталонный набор, которому она следует. Мы реализуем эту идею в двух формах. Направление по эталонному среднему не требует обучения: оно вычисляет поправку среднего конечных точек в замкнутой форме из банка эталонов и применяет ее к замороженной модели FLUX.2-klein (4B), обеспечивая контроль цвета, идентичности, стиля и структуры при фиксированных подсказке, начальном состоянии и весах. Полупараметрическое направление амортизирует ту же идею с помощью явного якоря среднего и обученного остаточного уточнителя, достигая качества безусловного DiT-B/4 на AFHQv2, при этом позволяя заменять эталонный набор во время инференса. Эти результаты указывают на более широкое направление: генеративные модели, которые адаптируются через данные, а не через обновление параметров.

English

Existing approaches to controllable generation typically rely on fine-tuning, auxiliary networks, or test-time search. We show that flow matching admits a different control interface: adaptation through examples. For deterministic interpolants, the velocity field is solely governed by a conditional endpoint mean; shifting this mean shifts the flow itself. This yields a simple principle for controllable generation: steer a pretrained model by changing the reference set it follows. We instantiate this idea in two forms. Reference-Mean Guidance is training-free: it computes a closed-form endpoint-mean correction from a reference bank and applies it to a frozen FLUX.2-klein (4B) model, enabling control of color, identity, style, and structure while keeping the prompt, seed, and weights fixed. Semi-Parametric Guidance amortizes the same idea through an explicit mean anchor and learned residual refiner, matching unconditional DiT-B/4 quality on AFHQv2 while allowing the reference set to be swapped at inference time. These results point to a broader direction: generative models that adapt through data, not parameter updates.