ChatPaper.aiChatPaper

PuLID: Pure en Bliksemsnelle ID-aanpassing via Contrastieve Uitlijning

PuLID: Pure and Lightning ID Customization via Contrastive Alignment

April 24, 2024
Auteurs: Zinan Guo, Yanze Wu, Zhuowei Chen, Lang Chen, Qian He
cs.AI

Samenvatting

Wij stellen Pure and Lightning ID customization (PuLID) voor, een nieuwe, afstemningsvrije methode voor ID-aanpassing in tekst-naar-beeldgeneratie. Door een Lightning T2I-tak te integreren met een standaard diffusietak, introduceert PuLID zowel een contrastieve uitlijningsverliesfunctie als een nauwkeurige ID-verliesfunctie, waardoor verstoring van het oorspronkelijke model wordt geminimaliseerd en een hoge ID-getrouwheid wordt gegarandeerd. Experimenten tonen aan dat PuLID superieure prestaties levert op het gebied van zowel ID-getrouwheid als bewerkbaarheid. Een ander aantrekkelijk kenmerk van PuLID is dat de beeld-elementen (bijvoorbeeld achtergrond, belichting, compositie en stijl) voor en na de ID-invoeging zo consistent mogelijk blijven. Codes en modellen zullen beschikbaar zijn op https://github.com/ToTheBeginning/PuLID.
English
We propose Pure and Lightning ID customization (PuLID), a novel tuning-free ID customization method for text-to-image generation. By incorporating a Lightning T2I branch with a standard diffusion one, PuLID introduces both contrastive alignment loss and accurate ID loss, minimizing disruption to the original model and ensuring high ID fidelity. Experiments show that PuLID achieves superior performance in both ID fidelity and editability. Another attractive property of PuLID is that the image elements (e.g., background, lighting, composition, and style) before and after the ID insertion are kept as consistent as possible. Codes and models will be available at https://github.com/ToTheBeginning/PuLID
PDF251December 15, 2024