ChatPaper.aiChatPaper

PLANNER: Geração de Parágrafos Diversificados via Modelo de Difusão Latente de Linguagem

PLANNER: Generating Diversified Paragraph via Latent Language Diffusion Model

June 5, 2023
Autores: Yizhe Zhang, Jiatao Gu, Zhuofeng Wu, Shuangfei Zhai, Josh Susskind, Navdeep Jaitly
cs.AI

Resumo

Modelos autoregressivos para texto às vezes geram saídas repetitivas e de baixa qualidade porque os erros se acumulam durante as etapas de geração. Esse problema é frequentemente atribuído ao viés de exposição - a diferença entre como um modelo é treinado e como ele é usado durante a inferência. Modelos de difusão de denoising oferecem uma abordagem alternativa na qual um modelo pode revisitar e revisar sua saída. No entanto, eles podem ser computacionalmente caros, e esforços anteriores com texto resultaram em modelos que produzem saídas menos fluentes em comparação com modelos autoregressivos, especialmente para textos e parágrafos mais longos. Neste artigo, propomos o PLANNER, um modelo que combina difusão semântica latente com geração autoregressiva, para gerar texto fluente enquanto exerce controle global sobre parágrafos. O modelo alcança isso combinando um módulo de "decodificação" autoregressivo com um módulo de "planejamento" que usa difusão latente para gerar embeddings semânticos de parágrafos de maneira grossa para fina. O método proposto é avaliado em várias tarefas de geração condicional, e os resultados em geração semântica, conclusão de texto e sumarização mostram sua eficácia na geração de texto longo de alta qualidade de maneira eficiente.
English
Autoregressive models for text sometimes generate repetitive and low-quality output because errors accumulate during the steps of generation. This issue is often attributed to exposure bias - the difference between how a model is trained, and how it is used during inference. Denoising diffusion models provide an alternative approach in which a model can revisit and revise its output. However, they can be computationally expensive and prior efforts on text have led to models that produce less fluent output compared to autoregressive models, especially for longer text and paragraphs. In this paper, we propose PLANNER, a model that combines latent semantic diffusion with autoregressive generation, to generate fluent text while exercising global control over paragraphs. The model achieves this by combining an autoregressive "decoding" module with a "planning" module that uses latent diffusion to generate semantic paragraph embeddings in a coarse-to-fine manner. The proposed method is evaluated on various conditional generation tasks, and results on semantic generation, text completion and summarization show its effectiveness in generating high-quality long-form text in an efficient manner.
PDF10December 15, 2024