RecTable: Modelado Rápido de Datos Tabulares con Flujo Rectificado
RecTable: Fast Modeling Tabular Data with Rectified Flow
March 26, 2025
Autores: Masane Fuchi, Tomohiro Takagi
cs.AI
Resumen
Los modelos basados en puntuación o de difusión generan datos tabulares de alta calidad, superando a los modelos basados en GAN y VAE. Sin embargo, estos métodos requieren un tiempo de entrenamiento considerable. En este artículo, presentamos RecTable, que utiliza el modelado de flujo rectificado, aplicado en áreas como la generación de texto a imagen y texto a video. RecTable se caracteriza por una arquitectura simple que consta de unos pocos bloques de unidades lineales con compuerta apilados. Además, nuestras estrategias de entrenamiento también son sencillas, incorporando una distribución de ruido de tipo mixto y una distribución de pasos de tiempo logit-normal. Nuestros experimentos demuestran que RecTable logra un rendimiento competitivo en comparación con varios modelos de difusión y basados en puntuación de última generación, mientras reduce el tiempo de entrenamiento requerido. Nuestro código está disponible en https://github.com/fmp453/rectable.
English
Score-based or diffusion models generate high-quality tabular data,
surpassing GAN-based and VAE-based models. However, these methods require
substantial training time. In this paper, we introduce RecTable, which uses the
rectified flow modeling, applied in such as text-to-image generation and
text-to-video generation. RecTable features a simple architecture consisting of
a few stacked gated linear unit blocks. Additionally, our training strategies
are also simple, incorporating a mixed-type noise distribution and a
logit-normal timestep distribution. Our experiments demonstrate that RecTable
achieves competitive performance compared to the several state-of-the-art
diffusion and score-based models while reducing the required training time. Our
code is available at https://github.com/fmp453/rectable.Summary
AI-Generated Summary