Prompt-Erweiterung für adaptive Text-zu-Bild-Generierung

papers.abstract

Text-to-Image-Generationsmodelle sind leistungsstark, aber schwierig zu bedienen. Benutzer formulieren spezifische Prompts, um bessere Bilder zu erhalten, obwohl die Bilder oft repetitiv sein können. Dieses Paper stellt ein Prompt-Expansion-Framework vor, das Benutzern hilft, mit weniger Aufwand hochwertige und vielfältige Bilder zu generieren. Das Prompt-Expansion-Modell nimmt eine Textanfrage als Eingabe und gibt eine Reihe erweiterter Textprompts aus, die so optimiert sind, dass sie, wenn sie an ein Text-to-Image-Modell übergeben werden, eine größere Vielfalt an ansprechenden Bildern erzeugen. Wir führen eine menschliche Evaluierungsstudie durch, die zeigt, dass Bilder, die durch Prompt Expansion generiert werden, ästhetisch ansprechender und vielfältiger sind als diejenigen, die mit Baseline-Methoden erzeugt werden. Insgesamt präsentiert dieses Paper einen neuartigen und effektiven Ansatz zur Verbesserung der Text-to-Image-Generationserfahrung.

English

Text-to-image generation models are powerful but difficult to use. Users craft specific prompts to get better images, though the images can be repetitive. This paper proposes a Prompt Expansion framework that helps users generate high-quality, diverse images with less effort. The Prompt Expansion model takes a text query as input and outputs a set of expanded text prompts that are optimized such that when passed to a text-to-image model, generates a wider variety of appealing images. We conduct a human evaluation study that shows that images generated through Prompt Expansion are more aesthetically pleasing and diverse than those generated by baseline methods. Overall, this paper presents a novel and effective approach to improving the text-to-image generation experience.

Prompt-Erweiterung für adaptive Text-zu-Bild-Generierung

Prompt Expansion for Adaptive Text-to-Image Generation

papers.abstract

Support