ChatPaper.aiChatPaper

Flux Discret Correspondant

Discrete Flow Matching

July 22, 2024
Auteurs: Itai Gat, Tal Remez, Neta Shaul, Felix Kreuk, Ricky T. Q. Chen, Gabriel Synnaeve, Yossi Adi, Yaron Lipman
cs.AI

Résumé

Bien que le Flow Matching et les modèles de diffusion soient apparus comme des paradigmes génératifs puissants pour les variables continues telles que les images et les vidéos, leur application aux données discrètes de haute dimension, comme le langage, reste limitée. Dans ce travail, nous présentons le Discrete Flow Matching, un nouveau paradigme de flux discret conçu spécifiquement pour générer des données discrètes. Le Discrete Flow Matching apporte plusieurs contributions clés : (i) il fonctionne avec une famille générale de chemins de probabilité interpolant entre les distributions source et cible ; (ii) il permet une formule générique pour l'échantillonnage à partir de ces chemins de probabilité en utilisant des postérieurs appris tels que le débruiteur de probabilité (prédiction x) et la prédiction de bruit (prédiction epsilon) ; (iii) en pratique, se concentrer sur des chemins de probabilité spécifiques définis avec différents planificateurs améliore considérablement la perplexité générative par rapport aux modèles de diffusion et de flux discrets précédents ; et (iv) en augmentant la taille des modèles de Discrete Flow Matching jusqu'à 1,7 milliard de paramètres, nous atteignons 6,7 % de Pass@1 et 13,4 % de Pass@10 sur HumanEval, ainsi que 6,7 % de Pass@1 et 20,6 % de Pass@10 sur les benchmarks de codage MBPP en 1-shot. Notre approche est capable de générer des données discrètes de haute qualité de manière non autorégressive, réduisant significativement l'écart entre les modèles autorégressifs et les modèles de flux discrets.
English
Despite Flow Matching and diffusion models having emerged as powerful generative paradigms for continuous variables such as images and videos, their application to high-dimensional discrete data, such as language, is still limited. In this work, we present Discrete Flow Matching, a novel discrete flow paradigm designed specifically for generating discrete data. Discrete Flow Matching offers several key contributions: (i) it works with a general family of probability paths interpolating between source and target distributions; (ii) it allows for a generic formula for sampling from these probability paths using learned posteriors such as the probability denoiser (x-prediction) and noise-prediction (epsilon-prediction); (iii) practically, focusing on specific probability paths defined with different schedulers considerably improves generative perplexity compared to previous discrete diffusion and flow models; and (iv) by scaling Discrete Flow Matching models up to 1.7B parameters, we reach 6.7% Pass@1 and 13.4% Pass@10 on HumanEval and 6.7% Pass@1 and 20.6% Pass@10 on 1-shot MBPP coding benchmarks. Our approach is capable of generating high-quality discrete data in a non-autoregressive fashion, significantly closing the gap between autoregressive models and discrete flow models.

Summary

AI-Generated Summary

PDF132November 28, 2024