RecTable: Snel modelleren van tabelgegevens met gecorrigeerde stroming
RecTable: Fast Modeling Tabular Data with Rectified Flow
March 26, 2025
Auteurs: Masane Fuchi, Tomohiro Takagi
cs.AI
Samenvatting
Score-based of diffusiemodellen genereren hoogwaardige tabelgegevens en overtreffen GAN-gebaseerde en VAE-gebaseerde modellen. Deze methoden vereisen echter aanzienlijke trainingsduur. In dit artikel introduceren we RecTable, dat gebruikmaakt van rectified flow-modellering, zoals toegepast in tekst-naar-beeldgeneratie en tekst-naar-videogeneratie. RecTable kenmerkt zich door een eenvoudige architectuur die bestaat uit enkele gestapelde gated linear unit-blokken. Daarnaast zijn onze trainingsstrategieën ook eenvoudig, waarbij een gemengde ruisverdeling en een logit-normale tijdsstapverdeling worden geïntegreerd. Onze experimenten tonen aan dat RecTable competitieve prestaties behaalt in vergelijking met verschillende state-of-the-art diffusie- en score-based modellen, terwijl de benodigde trainingsduur wordt verkort. Onze code is beschikbaar op https://github.com/fmp453/rectable.
English
Score-based or diffusion models generate high-quality tabular data,
surpassing GAN-based and VAE-based models. However, these methods require
substantial training time. In this paper, we introduce RecTable, which uses the
rectified flow modeling, applied in such as text-to-image generation and
text-to-video generation. RecTable features a simple architecture consisting of
a few stacked gated linear unit blocks. Additionally, our training strategies
are also simple, incorporating a mixed-type noise distribution and a
logit-normal timestep distribution. Our experiments demonstrate that RecTable
achieves competitive performance compared to the several state-of-the-art
diffusion and score-based models while reducing the required training time. Our
code is available at https://github.com/fmp453/rectable.Summary
AI-Generated Summary