RecTable : Modélisation rapide de données tabulaires avec flux rectifié
RecTable: Fast Modeling Tabular Data with Rectified Flow
March 26, 2025
Auteurs: Masane Fuchi, Tomohiro Takagi
cs.AI
Résumé
Les modèles basés sur les scores ou de diffusion génèrent des données tabulaires de haute qualité, surpassant les modèles basés sur les GAN et les VAE. Cependant, ces méthodes nécessitent un temps d'entraînement substantiel. Dans cet article, nous présentons RecTable, qui utilise la modélisation par flux rectifié, appliquée notamment dans la génération de texte à image et de texte à vidéo. RecTable se caractérise par une architecture simple composée de quelques blocs d'unités linéaires à porte. De plus, nos stratégies d'entraînement sont également simples, incorporant une distribution de bruit de type mixte et une distribution de pas de temps logit-normale. Nos expériences démontrent que RecTable atteint des performances compétitives par rapport à plusieurs modèles de diffusion et basés sur les scores de pointe, tout en réduisant le temps d'entraînement requis. Notre code est disponible à l'adresse https://github.com/fmp453/rectable.
English
Score-based or diffusion models generate high-quality tabular data,
surpassing GAN-based and VAE-based models. However, these methods require
substantial training time. In this paper, we introduce RecTable, which uses the
rectified flow modeling, applied in such as text-to-image generation and
text-to-video generation. RecTable features a simple architecture consisting of
a few stacked gated linear unit blocks. Additionally, our training strategies
are also simple, incorporating a mixed-type noise distribution and a
logit-normal timestep distribution. Our experiments demonstrate that RecTable
achieves competitive performance compared to the several state-of-the-art
diffusion and score-based models while reducing the required training time. Our
code is available at https://github.com/fmp453/rectable.Summary
AI-Generated Summary