ChatPaper.aiChatPaper

IDAdapter: Обучение смешанных признаков для персонализации моделей текст-к-изображению без настройки.

IDAdapter: Learning Mixed Features for Tuning-Free Personalization of Text-to-Image Models

March 20, 2024
Авторы: Siying Cui, Jiankang Deng, Jia Guo, Xiang An, Yongle Zhao, Xinyu Wei, Ziyong Feng
cs.AI

Аннотация

Использование стабильной диффузии для создания персонализированных портретов стало мощным и значительным инструментом, позволяющим пользователям создавать высококачественные индивидуальные аватары персонажей на основе конкретных запросов. Однако существующие методы персонализации сталкиваются с проблемами, включая настройку во время тестирования, необходимость использования нескольких входных изображений, низкое сохранение идентичности и ограниченное разнообразие в созданных результатах. Для преодоления этих препятствий мы представляем IDAdapter, подход без настройки, который улучшает разнообразие и сохранение идентичности при создании персонализированных изображений из одного изображения лица. IDAdapter интегрирует персонализированное понятие в процесс генерации через комбинацию текстовых и визуальных инъекций и потерю идентичности лица. Во время фазы обучения мы включаем смешанные характеристики из нескольких эталонных изображений конкретной личности для обогащения деталей, связанных с идентичностью, направляя модель на генерацию изображений с более разнообразными стилями, выражениями и углами по сравнению с предыдущими работами. Обширные оценки демонстрируют эффективность нашего метода, достигая как разнообразия, так и сохранения идентичности в созданных изображениях.
English
Leveraging Stable Diffusion for the generation of personalized portraits has emerged as a powerful and noteworthy tool, enabling users to create high-fidelity, custom character avatars based on their specific prompts. However, existing personalization methods face challenges, including test-time fine-tuning, the requirement of multiple input images, low preservation of identity, and limited diversity in generated outcomes. To overcome these challenges, we introduce IDAdapter, a tuning-free approach that enhances the diversity and identity preservation in personalized image generation from a single face image. IDAdapter integrates a personalized concept into the generation process through a combination of textual and visual injections and a face identity loss. During the training phase, we incorporate mixed features from multiple reference images of a specific identity to enrich identity-related content details, guiding the model to generate images with more diverse styles, expressions, and angles compared to previous works. Extensive evaluations demonstrate the effectiveness of our method, achieving both diversity and identity fidelity in generated images.

Summary

AI-Generated Summary

PDF241December 15, 2024