RecTable: Modelagem Rápida de Dados Tabulares com Fluxo Retificado
RecTable: Fast Modeling Tabular Data with Rectified Flow
March 26, 2025
Autores: Masane Fuchi, Tomohiro Takagi
cs.AI
Resumo
Modelos baseados em pontuação ou de difusão geram dados tabulares de alta qualidade, superando modelos baseados em GANs e VAEs. No entanto, esses métodos exigem um tempo de treinamento substancial. Neste artigo, apresentamos o RecTable, que utiliza a modelagem de fluxo retificado, aplicada em áreas como geração de texto para imagem e texto para vídeo. O RecTable possui uma arquitetura simples, composta por alguns blocos de unidades lineares com portas empilhadas. Além disso, nossas estratégias de treinamento também são simples, incorporando uma distribuição de ruído de tipo misto e uma distribuição de passos de tempo logit-normal. Nossos experimentos demonstram que o RecTable alcança desempenho competitivo em comparação com vários modelos de difusão e baseados em pontuação de última geração, enquanto reduz o tempo de treinamento necessário. Nosso código está disponível em https://github.com/fmp453/rectable.
English
Score-based or diffusion models generate high-quality tabular data,
surpassing GAN-based and VAE-based models. However, these methods require
substantial training time. In this paper, we introduce RecTable, which uses the
rectified flow modeling, applied in such as text-to-image generation and
text-to-video generation. RecTable features a simple architecture consisting of
a few stacked gated linear unit blocks. Additionally, our training strategies
are also simple, incorporating a mixed-type noise distribution and a
logit-normal timestep distribution. Our experiments demonstrate that RecTable
achieves competitive performance compared to the several state-of-the-art
diffusion and score-based models while reducing the required training time. Our
code is available at https://github.com/fmp453/rectable.Summary
AI-Generated Summary