PLANNER: Generación de Párrafos Diversificados mediante Modelo de Difusión de Lenguaje Latente

Resumen

Los modelos autorregresivos para texto a veces generan resultados repetitivos y de baja calidad debido a que los errores se acumulan durante los pasos de generación. Este problema se atribuye frecuentemente al sesgo de exposición: la diferencia entre cómo se entrena un modelo y cómo se utiliza durante la inferencia. Los modelos de difusión de denoising ofrecen un enfoque alternativo en el que un modelo puede revisar y corregir su salida. Sin embargo, pueden ser computacionalmente costosos, y esfuerzos previos en texto han dado lugar a modelos que producen resultados menos fluidos en comparación con los modelos autorregresivos, especialmente para textos y párrafos más largos. En este artículo, proponemos PLANNER, un modelo que combina la difusión semántica latente con la generación autorregresiva para generar texto fluido mientras ejerce un control global sobre los párrafos. El modelo logra esto al combinar un módulo de "decodificación" autorregresivo con un módulo de "planificación" que utiliza difusión latente para generar embeddings semánticos de párrafos de manera gruesa a fina. El método propuesto se evalúa en diversas tareas de generación condicional, y los resultados en generación semántica, completación de texto y resumen muestran su eficacia para generar texto de alta calidad y extenso de manera eficiente.

English

Autoregressive models for text sometimes generate repetitive and low-quality output because errors accumulate during the steps of generation. This issue is often attributed to exposure bias - the difference between how a model is trained, and how it is used during inference. Denoising diffusion models provide an alternative approach in which a model can revisit and revise its output. However, they can be computationally expensive and prior efforts on text have led to models that produce less fluent output compared to autoregressive models, especially for longer text and paragraphs. In this paper, we propose PLANNER, a model that combines latent semantic diffusion with autoregressive generation, to generate fluent text while exercising global control over paragraphs. The model achieves this by combining an autoregressive "decoding" module with a "planning" module that uses latent diffusion to generate semantic paragraph embeddings in a coarse-to-fine manner. The proposed method is evaluated on various conditional generation tasks, and results on semantic generation, text completion and summarization show its effectiveness in generating high-quality long-form text in an efficient manner.

PLANNER: Generación de Párrafos Diversificados mediante Modelo de Difusión de Lenguaje Latente

PLANNER: Generating Diversified Paragraph via Latent Language Diffusion Model

Resumen

Support