ChatPaper.aiChatPaper

StrandDesigner: Практический подход к генерации прядей с использованием эскизного руководства

StrandDesigner: Towards Practical Strand Generation with Sketch Guidance

August 3, 2025
Авторы: Na Zhang, Moran Li, Chengming Xu, Han Feng, Xiaobin Hu, Jiangning Zhang, Weijian Cao, Chengjie Wang, Yanwei Fu
cs.AI

Аннотация

Реалистичная генерация отдельных волос имеет решающее значение для таких приложений, как компьютерная графика и виртуальная реальность. Хотя диффузионные модели могут создавать прически на основе текста или изображений, эти входные данные недостаточно точны и удобны для пользователя. Вместо этого мы предлагаем первую модель генерации волос на основе эскизов, которая обеспечивает более точный контроль, оставаясь при этом удобной для пользователя. Наша структура решает ключевые задачи, такие как моделирование сложных взаимодействий волос и разнообразных паттернов эскизов, с помощью двух основных инноваций: обучаемой стратегии повышения детализации волос, которая кодирует 3D-волосы в многомасштабные латентные пространства, и многомасштабного адаптивного механизма кондиционирования с использованием трансформера с диффузионными головками для обеспечения согласованности на разных уровнях детализации. Эксперименты на нескольких эталонных наборах данных показывают, что наш метод превосходит существующие подходы по реалистичности и точности. Качественные результаты дополнительно подтверждают его эффективность. Код будет опубликован на [GitHub](https://github.com/fighting-Zhang/StrandDesigner).
English
Realistic hair strand generation is crucial for applications like computer graphics and virtual reality. While diffusion models can generate hairstyles from text or images, these inputs lack precision and user-friendliness. Instead, we propose the first sketch-based strand generation model, which offers finer control while remaining user-friendly. Our framework tackles key challenges, such as modeling complex strand interactions and diverse sketch patterns, through two main innovations: a learnable strand upsampling strategy that encodes 3D strands into multi-scale latent spaces, and a multi-scale adaptive conditioning mechanism using a transformer with diffusion heads to ensure consistency across granularity levels. Experiments on several benchmark datasets show our method outperforms existing approaches in realism and precision. Qualitative results further confirm its effectiveness. Code will be released at [GitHub](https://github.com/fighting-Zhang/StrandDesigner).
PDF63August 8, 2025