Fluxo Normalizador Bidirecional: Dos Dados ao Ruído e de Volta

Resumo

Os Fluxos de Normalização (NFs) estabeleceram-se como uma estrutura fundamentada para modelagem generativa. Os NFs padrão consistem num processo direto e num processo inverso: o processo direto mapeia dados para ruído, enquanto o processo inverso gera amostras invertendo-o. As transformações diretas típicas dos NFs são condicionadas por invertibilidade explícita, garantindo que o processo inverso possa funcionar como a sua inversa analítica exata. Os desenvolvimentos recentes no TARFlow e suas variantes revitalizaram os métodos NF ao combinar Transformers e fluxos autorregressivos, mas também expuseram a descodificação causal como um grande estrangulamento. Neste trabalho, introduzimos o Fluxo de Normalização Bidirecional (BiFlow), uma estrutura que elimina a necessidade de uma inversa analítica exata. O BiFlow aprende um modelo inverso que aproxima o mapeamento inverso subjacente de ruído-para-dados, permitindo funções de perda e arquiteturas mais flexíveis. Experiências no ImageNet demonstram que o BiFlow, comparado com a sua contraparte de descodificação causal, melhora a qualidade da geração enquanto acelera a amostragem em até duas ordens de magnitude. O BiFlow produz resultados de última geração entre os métodos baseados em NFs e um desempenho competitivo entre os métodos de avaliação única ("1-NFE"). Seguindo os progressos encorajadores recentes nos NFs, esperamos que o nosso trabalho atraia mais atenção para este paradigma clássico.

English

Normalizing Flows (NFs) have been established as a principled framework for generative modeling. Standard NFs consist of a forward process and a reverse process: the forward process maps data to noise, while the reverse process generates samples by inverting it. Typical NF forward transformations are constrained by explicit invertibility, ensuring that the reverse process can serve as their exact analytic inverse. Recent developments in TARFlow and its variants have revitalized NF methods by combining Transformers and autoregressive flows, but have also exposed causal decoding as a major bottleneck. In this work, we introduce Bidirectional Normalizing Flow (BiFlow), a framework that removes the need for an exact analytic inverse. BiFlow learns a reverse model that approximates the underlying noise-to-data inverse mapping, enabling more flexible loss functions and architectures. Experiments on ImageNet demonstrate that BiFlow, compared to its causal decoding counterpart, improves generation quality while accelerating sampling by up to two orders of magnitude. BiFlow yields state-of-the-art results among NF-based methods and competitive performance among single-evaluation ("1-NFE") methods. Following recent encouraging progress on NFs, we hope our work will draw further attention to this classical paradigm.

Fluxo Normalizador Bidirecional: Dos Dados ao Ruído e de Volta

Bidirectional Normalizing Flow: From Data to Noise and Back

Resumo

Support