IDAdapter: Apprendimento di Caratteristiche Miste per la Personalizzazione Senza Modifiche dei Modelli di Generazione di Immagini da Testo

Abstract

L'utilizzo di Stable Diffusion per la generazione di ritratti personalizzati è emerso come uno strumento potente e degno di nota, consentendo agli utenti di creare avatar di personaggi personalizzati ad alta fedeltà basati su prompt specifici. Tuttavia, i metodi di personalizzazione esistenti affrontano diverse sfide, tra cui la messa a punto in fase di test, la necessità di più immagini di input, la scarsa conservazione dell'identità e una limitata diversità nei risultati generati. Per superare queste sfide, introduciamo IDAdapter, un approccio senza messa a punto che migliora la diversità e la conservazione dell'identità nella generazione di immagini personalizzate a partire da una singola immagine facciale. IDAdapter integra un concetto personalizzato nel processo di generazione attraverso una combinazione di iniezioni testuali e visive e una perdita di identità facciale. Durante la fase di addestramento, incorporiamo caratteristiche miste da più immagini di riferimento di una specifica identità per arricchire i dettagli relativi al contenuto dell'identità, guidando il modello a generare immagini con stili, espressioni e angolazioni più diversificati rispetto ai lavori precedenti. Valutazioni estensive dimostrano l'efficacia del nostro metodo, raggiungendo sia la diversità che la fedeltà dell'identità nelle immagini generate.

English

Leveraging Stable Diffusion for the generation of personalized portraits has emerged as a powerful and noteworthy tool, enabling users to create high-fidelity, custom character avatars based on their specific prompts. However, existing personalization methods face challenges, including test-time fine-tuning, the requirement of multiple input images, low preservation of identity, and limited diversity in generated outcomes. To overcome these challenges, we introduce IDAdapter, a tuning-free approach that enhances the diversity and identity preservation in personalized image generation from a single face image. IDAdapter integrates a personalized concept into the generation process through a combination of textual and visual injections and a face identity loss. During the training phase, we incorporate mixed features from multiple reference images of a specific identity to enrich identity-related content details, guiding the model to generate images with more diverse styles, expressions, and angles compared to previous works. Extensive evaluations demonstrate the effectiveness of our method, achieving both diversity and identity fidelity in generated images.

IDAdapter: Apprendimento di Caratteristiche Miste per la Personalizzazione Senza Modifiche dei Modelli di Generazione di Immagini da Testo

IDAdapter: Learning Mixed Features for Tuning-Free Personalization of Text-to-Image Models

Abstract

Support