ChatPaper.aiChatPaper

Promptuitbreiding voor Adaptieve Tekst-naar-Beeld Generatie

Prompt Expansion for Adaptive Text-to-Image Generation

December 27, 2023
Auteurs: Siddhartha Datta, Alexander Ku, Deepak Ramachandran, Peter Anderson
cs.AI

Samenvatting

Text-to-image-generatiemodellen zijn krachtig maar moeilijk te gebruiken. Gebruikers maken specifieke prompts om betere afbeeldingen te krijgen, hoewel de afbeeldingen repetitief kunnen zijn. Dit artikel stelt een Prompt Expansion-framework voor dat gebruikers helpt om met minder inspanning hoogwaardige, diverse afbeeldingen te genereren. Het Prompt Expansion-model neemt een tekstquery als invoer en produceert een set uitgebreide tekstprompts die zo zijn geoptimaliseerd dat ze, wanneer ze aan een text-to-image-model worden doorgegeven, een breder scala aan aantrekkelijke afbeeldingen genereren. We voeren een gebruikersevaluatiestudie uit die aantoont dat afbeeldingen gegenereerd via Prompt Expansion esthetisch aantrekkelijker en diverser zijn dan die gegenereerd door baseline-methoden. Over het geheel genomen presenteert dit artikel een nieuwe en effectieve aanpak om de text-to-image-generatie-ervaring te verbeteren.
English
Text-to-image generation models are powerful but difficult to use. Users craft specific prompts to get better images, though the images can be repetitive. This paper proposes a Prompt Expansion framework that helps users generate high-quality, diverse images with less effort. The Prompt Expansion model takes a text query as input and outputs a set of expanded text prompts that are optimized such that when passed to a text-to-image model, generates a wider variety of appealing images. We conduct a human evaluation study that shows that images generated through Prompt Expansion are more aesthetically pleasing and diverse than those generated by baseline methods. Overall, this paper presents a novel and effective approach to improving the text-to-image generation experience.
PDF61February 7, 2026