ChatPaper.aiChatPaper

IDAdapter: Aprendendo Recursos Mistos para Personalização sem Ajuste de Modelos de Texto para Imagem

IDAdapter: Learning Mixed Features for Tuning-Free Personalization of Text-to-Image Models

March 20, 2024
Autores: Siying Cui, Jiankang Deng, Jia Guo, Xiang An, Yongle Zhao, Xinyu Wei, Ziyong Feng
cs.AI

Resumo

A utilização do Stable Diffusion para a geração de retratos personalizados emergiu como uma ferramenta poderosa e notável, permitindo que os usuários criem avatares de personagens personalizados de alta fidelidade com base em seus prompts específicos. No entanto, os métodos de personalização existentes enfrentam desafios, incluindo ajuste fino em tempo de teste, a necessidade de múltiplas imagens de entrada, baixa preservação de identidade e diversidade limitada nos resultados gerados. Para superar esses desafios, apresentamos o IDAdapter, uma abordagem sem ajuste fino que melhora a diversidade e a preservação de identidade na geração de imagens personalizadas a partir de uma única imagem facial. O IDAdapter integra um conceito personalizado no processo de geração por meio de uma combinação de injeções textuais e visuais e uma perda de identidade facial. Durante a fase de treinamento, incorporamos características mistas de múltiplas imagens de referência de uma identidade específica para enriquecer os detalhes de conteúdo relacionados à identidade, orientando o modelo a gerar imagens com estilos, expressões e ângulos mais diversos em comparação com trabalhos anteriores. Avaliações extensivas demonstram a eficácia do nosso método, alcançando tanto diversidade quanto fidelidade de identidade nas imagens geradas.
English
Leveraging Stable Diffusion for the generation of personalized portraits has emerged as a powerful and noteworthy tool, enabling users to create high-fidelity, custom character avatars based on their specific prompts. However, existing personalization methods face challenges, including test-time fine-tuning, the requirement of multiple input images, low preservation of identity, and limited diversity in generated outcomes. To overcome these challenges, we introduce IDAdapter, a tuning-free approach that enhances the diversity and identity preservation in personalized image generation from a single face image. IDAdapter integrates a personalized concept into the generation process through a combination of textual and visual injections and a face identity loss. During the training phase, we incorporate mixed features from multiple reference images of a specific identity to enrich identity-related content details, guiding the model to generate images with more diverse styles, expressions, and angles compared to previous works. Extensive evaluations demonstrate the effectiveness of our method, achieving both diversity and identity fidelity in generated images.
PDF231February 7, 2026