IDAdapter: Aprendizaje de características mixtas para la personalización sin ajustes de modelos de texto a imagen
IDAdapter: Learning Mixed Features for Tuning-Free Personalization of Text-to-Image Models
March 20, 2024
Autores: Siying Cui, Jiankang Deng, Jia Guo, Xiang An, Yongle Zhao, Xinyu Wei, Ziyong Feng
cs.AI
Resumen
El uso de Stable Diffusion para la generación de retratos personalizados ha surgido como una herramienta poderosa y destacada, permitiendo a los usuarios crear avatares de personajes personalizados de alta fidelidad basados en sus indicaciones específicas. Sin embargo, los métodos de personalización existentes enfrentan desafíos, como el ajuste fino en tiempo de prueba, la necesidad de múltiples imágenes de entrada, la baja preservación de la identidad y la diversidad limitada en los resultados generados. Para superar estos desafíos, presentamos IDAdapter, un enfoque sin ajuste fino que mejora la diversidad y la preservación de la identidad en la generación de imágenes personalizadas a partir de una sola imagen facial. IDAdapter integra un concepto personalizado en el proceso de generación mediante una combinación de inyecciones textuales y visuales y una pérdida de identidad facial. Durante la fase de entrenamiento, incorporamos características mixtas de múltiples imágenes de referencia de una identidad específica para enriquecer los detalles relacionados con la identidad, guiando al modelo para generar imágenes con estilos, expresiones y ángulos más diversos en comparación con trabajos anteriores. Evaluaciones exhaustivas demuestran la efectividad de nuestro método, logrando tanto diversidad como fidelidad de identidad en las imágenes generadas.
English
Leveraging Stable Diffusion for the generation of personalized portraits has
emerged as a powerful and noteworthy tool, enabling users to create
high-fidelity, custom character avatars based on their specific prompts.
However, existing personalization methods face challenges, including test-time
fine-tuning, the requirement of multiple input images, low preservation of
identity, and limited diversity in generated outcomes. To overcome these
challenges, we introduce IDAdapter, a tuning-free approach that enhances the
diversity and identity preservation in personalized image generation from a
single face image. IDAdapter integrates a personalized concept into the
generation process through a combination of textual and visual injections and a
face identity loss. During the training phase, we incorporate mixed features
from multiple reference images of a specific identity to enrich
identity-related content details, guiding the model to generate images with
more diverse styles, expressions, and angles compared to previous works.
Extensive evaluations demonstrate the effectiveness of our method, achieving
both diversity and identity fidelity in generated images.Summary
AI-Generated Summary