ChatPaper.aiChatPaper

RecTable: Modelagem Rápida de Dados Tabulares com Fluxo Retificado

RecTable: Fast Modeling Tabular Data with Rectified Flow

March 26, 2025
Autores: Masane Fuchi, Tomohiro Takagi
cs.AI

Resumo

Modelos baseados em pontuação ou de difusão geram dados tabulares de alta qualidade, superando modelos baseados em GANs e VAEs. No entanto, esses métodos exigem um tempo de treinamento substancial. Neste artigo, apresentamos o RecTable, que utiliza a modelagem de fluxo retificado, aplicada em áreas como geração de texto para imagem e texto para vídeo. O RecTable possui uma arquitetura simples, composta por alguns blocos de unidades lineares com portas empilhadas. Além disso, nossas estratégias de treinamento também são simples, incorporando uma distribuição de ruído de tipo misto e uma distribuição de passos de tempo logit-normal. Nossos experimentos demonstram que o RecTable alcança desempenho competitivo em comparação com vários modelos de difusão e baseados em pontuação de última geração, enquanto reduz o tempo de treinamento necessário. Nosso código está disponível em https://github.com/fmp453/rectable.
English
Score-based or diffusion models generate high-quality tabular data, surpassing GAN-based and VAE-based models. However, these methods require substantial training time. In this paper, we introduce RecTable, which uses the rectified flow modeling, applied in such as text-to-image generation and text-to-video generation. RecTable features a simple architecture consisting of a few stacked gated linear unit blocks. Additionally, our training strategies are also simple, incorporating a mixed-type noise distribution and a logit-normal timestep distribution. Our experiments demonstrate that RecTable achieves competitive performance compared to the several state-of-the-art diffusion and score-based models while reducing the required training time. Our code is available at https://github.com/fmp453/rectable.

Summary

AI-Generated Summary

PDF22March 27, 2025