ChatPaper.aiChatPaper

Expansión de Prompt para Generación Adaptativa de Texto a Imagen

Prompt Expansion for Adaptive Text-to-Image Generation

December 27, 2023
Autores: Siddhartha Datta, Alexander Ku, Deepak Ramachandran, Peter Anderson
cs.AI

Resumen

Los modelos de generación de texto a imagen son potentes pero difíciles de usar. Los usuarios elaboran indicaciones específicas para obtener mejores imágenes, aunque estas pueden resultar repetitivas. Este artículo propone un marco de Expansión de Indicaciones que ayuda a los usuarios a generar imágenes de alta calidad y diversas con menos esfuerzo. El modelo de Expansión de Indicaciones toma una consulta de texto como entrada y produce un conjunto de indicaciones de texto expandidas que están optimizadas para que, al ser pasadas a un modelo de texto a imagen, generen una mayor variedad de imágenes atractivas. Realizamos un estudio de evaluación humana que muestra que las imágenes generadas mediante Expansión de Indicaciones son más estéticamente agradables y diversas que las generadas por métodos de referencia. En general, este artículo presenta un enfoque novedoso y efectivo para mejorar la experiencia de generación de texto a imagen.
English
Text-to-image generation models are powerful but difficult to use. Users craft specific prompts to get better images, though the images can be repetitive. This paper proposes a Prompt Expansion framework that helps users generate high-quality, diverse images with less effort. The Prompt Expansion model takes a text query as input and outputs a set of expanded text prompts that are optimized such that when passed to a text-to-image model, generates a wider variety of appealing images. We conduct a human evaluation study that shows that images generated through Prompt Expansion are more aesthetically pleasing and diverse than those generated by baseline methods. Overall, this paper presents a novel and effective approach to improving the text-to-image generation experience.
PDF61December 15, 2024