ChatPaper.aiChatPaper

Los Principios de los Modelos de Difusión

The Principles of Diffusion Models

October 24, 2025
Autores: Chieh-Hsin Lai, Yang Song, Dongjun Kim, Yuki Mitsufuji, Stefano Ermon
cs.AI

Resumen

Esta monografía presenta los principios fundamentales que han guiado el desarrollo de los modelos de difusión, rastreando sus orígenes y mostrando cómo diversas formulaciones surgen de ideas matemáticas compartidas. El modelado de difusión comienza definiendo un proceso directo que corrompe gradualmente los datos hasta convertirlos en ruido, vinculando la distribución de datos con una distribución previa simple a través de un continuo de distribuciones intermedias. El objetivo es aprender un proceso inverso que transforme el ruido nuevamente en datos mientras recupera los mismos estados intermedios. Describimos tres perspectivas complementarias. La perspectiva variacional, inspirada en los autoencoders variacionales, concibe la difusión como el aprendizaje para eliminar ruido paso a paso. La perspectiva basada en scores, con raíces en el modelado basado en energía, aprende el gradiente de la distribución de datos en evolución, indicando cómo dirigir las muestras hacia regiones más probables. La perspectiva basada en flujos, relacionada con los flujos normalizantes, trata la generación como seguir una trayectoria suave que mueve muestras desde el ruido hasta los datos bajo un campo de velocidad aprendido. Estas perspectivas comparten una estructura común: un campo de velocidad dependiente del tiempo cuyo flujo transporta una distribución previa simple hacia los datos. El muestreo equivale entonces a resolver una ecuación diferencial que evoluciona el ruido hacia los datos a lo largo de una trayectoria continua. Sobre esta base, la monografía discute técnicas de guía para generación controlable, solucionadores numéricos eficientes y modelos de mapas de flujo motivados por difusión que aprenden mapeos directos entre tiempos arbitrarios. Proporciona una comprensión conceptual y matemáticamente fundamentada de los modelos de difusión para lectores con conocimientos básicos de aprendizaje profundo.
English
This monograph presents the core principles that have guided the development of diffusion models, tracing their origins and showing how diverse formulations arise from shared mathematical ideas. Diffusion modeling starts by defining a forward process that gradually corrupts data into noise, linking the data distribution to a simple prior through a continuum of intermediate distributions. The goal is to learn a reverse process that transforms noise back into data while recovering the same intermediates. We describe three complementary views. The variational view, inspired by variational autoencoders, sees diffusion as learning to remove noise step by step. The score-based view, rooted in energy-based modeling, learns the gradient of the evolving data distribution, indicating how to nudge samples toward more likely regions. The flow-based view, related to normalizing flows, treats generation as following a smooth path that moves samples from noise to data under a learned velocity field. These perspectives share a common backbone: a time-dependent velocity field whose flow transports a simple prior to the data. Sampling then amounts to solving a differential equation that evolves noise into data along a continuous trajectory. On this foundation, the monograph discusses guidance for controllable generation, efficient numerical solvers, and diffusion-motivated flow-map models that learn direct mappings between arbitrary times. It provides a conceptual and mathematically grounded understanding of diffusion models for readers with basic deep-learning knowledge.
PDF583December 2, 2025