Prompt-Erweiterung für adaptive Text-zu-Bild-Generierung
Prompt Expansion for Adaptive Text-to-Image Generation
December 27, 2023
Autoren: Siddhartha Datta, Alexander Ku, Deepak Ramachandran, Peter Anderson
cs.AI
Zusammenfassung
Text-to-Image-Generationsmodelle sind leistungsstark, aber schwierig zu bedienen. Benutzer formulieren spezifische Prompts, um bessere Bilder zu erhalten, obwohl die Bilder oft repetitiv sein können. Dieses Paper stellt ein Prompt-Expansion-Framework vor, das Benutzern hilft, mit weniger Aufwand hochwertige und vielfältige Bilder zu generieren. Das Prompt-Expansion-Modell nimmt eine Textanfrage als Eingabe und gibt eine Reihe erweiterter Textprompts aus, die so optimiert sind, dass sie, wenn sie an ein Text-to-Image-Modell übergeben werden, eine größere Vielfalt an ansprechenden Bildern erzeugen. Wir führen eine menschliche Evaluierungsstudie durch, die zeigt, dass Bilder, die durch Prompt Expansion generiert werden, ästhetisch ansprechender und vielfältiger sind als diejenigen, die mit Baseline-Methoden erzeugt werden. Insgesamt präsentiert dieses Paper einen neuartigen und effektiven Ansatz zur Verbesserung der Text-to-Image-Generationserfahrung.
English
Text-to-image generation models are powerful but difficult to use. Users
craft specific prompts to get better images, though the images can be
repetitive. This paper proposes a Prompt Expansion framework that helps users
generate high-quality, diverse images with less effort. The Prompt Expansion
model takes a text query as input and outputs a set of expanded text prompts
that are optimized such that when passed to a text-to-image model, generates a
wider variety of appealing images. We conduct a human evaluation study that
shows that images generated through Prompt Expansion are more aesthetically
pleasing and diverse than those generated by baseline methods. Overall, this
paper presents a novel and effective approach to improving the text-to-image
generation experience.