RecTable: 整流フローによる表形式データの高速モデリング
RecTable: Fast Modeling Tabular Data with Rectified Flow
March 26, 2025
著者: Masane Fuchi, Tomohiro Takagi
cs.AI
要旨
スコアベースまたは拡散モデルは、GANベースやVAEベースのモデルを凌駕する高品質な表形式データを生成します。しかし、これらの手法は多大な訓練時間を要します。本論文では、テキストから画像生成やテキストから動画生成などに応用されている整流フローモデリングを利用したRecTableを紹介します。RecTableは、少数の積層ゲート線形ユニットブロックから成るシンプルなアーキテクチャを特徴としています。さらに、混合型ノイズ分布とロジット正規タイムステップ分布を組み込んだ、簡潔な訓練戦略も採用しています。実験の結果、RecTableは、いくつかの最先端の拡散およびスコアベースモデルと比較して競争力のある性能を達成しつつ、必要な訓練時間を削減できることが示されました。私たちのコードはhttps://github.com/fmp453/rectableで公開されています。
English
Score-based or diffusion models generate high-quality tabular data,
surpassing GAN-based and VAE-based models. However, these methods require
substantial training time. In this paper, we introduce RecTable, which uses the
rectified flow modeling, applied in such as text-to-image generation and
text-to-video generation. RecTable features a simple architecture consisting of
a few stacked gated linear unit blocks. Additionally, our training strategies
are also simple, incorporating a mixed-type noise distribution and a
logit-normal timestep distribution. Our experiments demonstrate that RecTable
achieves competitive performance compared to the several state-of-the-art
diffusion and score-based models while reducing the required training time. Our
code is available at https://github.com/fmp453/rectable.