DreamStyler: Schilderen door Stijl Inversie met Text-to-Image Diffusiemodellen
DreamStyler: Paint by Style Inversion with Text-to-Image Diffusion Models
September 13, 2023
Auteurs: Namhyuk Ahn, Junsoo Lee, Chunggi Lee, Kunhee Kim, Daesik Kim, Seung-Hun Nam, Kibeom Hong
cs.AI
Samenvatting
Recente vooruitgang in grootschalige tekst-naar-beeldmodellen heeft opmerkelijke prestaties opgeleverd, met diverse toepassingen in het artistieke domein. Het uitdrukken van unieke kenmerken van een kunstwerk (bijvoorbeeld penseelvoering, kleurtoon of compositie) met alleen tekstprompts kan echter beperkingen ondervinden vanwege de inherente beperkingen van verbale beschrijving. Daarom introduceren we DreamStyler, een nieuw raamwerk ontworpen voor artistieke beeldgeneratie, dat bedreven is in zowel tekst-naar-beeldsynthese als stijloverdracht. DreamStyler optimaliseert een meerfasige tekstuele embedding met een contextbewuste tekstprompt, wat resulteert in een opvallende beeldkwaliteit. Daarnaast toont DreamStyler, met inhoudelijke en stijlbepalende richtlijnen, flexibiliteit om een reeks stijlreferenties te accommoderen. Experimentele resultaten demonstreren de superieure prestaties in meerdere scenario's, wat wijst op het veelbelovende potentieel in artistieke productcreatie.
English
Recent progresses in large-scale text-to-image models have yielded remarkable
accomplishments, finding various applications in art domain. However,
expressing unique characteristics of an artwork (e.g. brushwork, colortone, or
composition) with text prompts alone may encounter limitations due to the
inherent constraints of verbal description. To this end, we introduce
DreamStyler, a novel framework designed for artistic image synthesis,
proficient in both text-to-image synthesis and style transfer. DreamStyler
optimizes a multi-stage textual embedding with a context-aware text prompt,
resulting in prominent image quality. In addition, with content and style
guidance, DreamStyler exhibits flexibility to accommodate a range of style
references. Experimental results demonstrate its superior performance across
multiple scenarios, suggesting its promising potential in artistic product
creation.