Pont de Markov discret
Discrete Markov Bridge
May 26, 2025
Auteurs: Hengli Li, Yuxuan Wang, Song-Chun Zhu, Ying Nian Wu, Zilong Zheng
cs.AI
Résumé
La diffusion discrète a récemment émergé comme un paradigme prometteur dans la modélisation de données discrètes. Cependant, les méthodes existantes reposent généralement sur une matrice de transition à taux fixe pendant l'entraînement, ce qui non seulement limite l'expressivité des représentations latentes, une force fondamentale des méthodes variationnelles, mais restreint également l'espace de conception global. Pour remédier à ces limitations, nous proposons Discrete Markov Bridge, un nouveau cadre spécifiquement conçu pour l'apprentissage de représentations discrètes. Notre approche repose sur deux composants clés : l'apprentissage de matrices et l'apprentissage de scores. Nous menons une analyse théorique rigoureuse, établissant des garanties de performance formelles pour l'apprentissage de matrices et prouvant la convergence du cadre global. De plus, nous analysons la complexité spatiale de notre méthode, en tenant compte des contraintes pratiques identifiées dans les études antérieures. Des évaluations empiriques approfondies valident l'efficacité du Discrete Markov Bridge proposé, qui atteint une borne inférieure d'évidence (ELBO) de 1,38 sur le jeu de données Text8, surpassant les bases de référence établies. Par ailleurs, le modèle proposé démontre des performances compétitives sur le jeu de données CIFAR-10, obtenant des résultats comparables à ceux des approches spécifiques à la génération d'images.
English
Discrete diffusion has recently emerged as a promising paradigm in discrete
data modeling. However, existing methods typically rely on a fixed rate
transition matrix during training, which not only limits the expressiveness of
latent representations, a fundamental strength of variational methods, but also
constrains the overall design space. To address these limitations, we propose
Discrete Markov Bridge, a novel framework specifically designed for discrete
representation learning. Our approach is built upon two key components: Matrix
Learning and Score Learning. We conduct a rigorous theoretical analysis,
establishing formal performance guarantees for Matrix Learning and proving the
convergence of the overall framework. Furthermore, we analyze the space
complexity of our method, addressing practical constraints identified in prior
studies. Extensive empirical evaluations validate the effectiveness of the
proposed Discrete Markov Bridge, which achieves an Evidence Lower Bound (ELBO)
of 1.38 on the Text8 dataset, outperforming established baselines. Moreover,
the proposed model demonstrates competitive performance on the CIFAR-10
dataset, achieving results comparable to those obtained by image-specific
generation approaches.Summary
AI-Generated Summary