ChatPaper.aiChatPaper

StrandDesigner: Verso una Generazione Pratica di Ciocche con Guida a Schizzo

StrandDesigner: Towards Practical Strand Generation with Sketch Guidance

August 3, 2025
Autori: Na Zhang, Moran Li, Chengming Xu, Han Feng, Xiaobin Hu, Jiangning Zhang, Weijian Cao, Chengjie Wang, Yanwei Fu
cs.AI

Abstract

La generazione realistica di ciocche di capelli è cruciale per applicazioni come la computer grafica e la realtà virtuale. Sebbene i modelli di diffusione possano generare acconciature a partire da testo o immagini, questi input mancano di precisione e facilità d'uso. Proponiamo invece il primo modello di generazione di ciocche basato su schizzi, che offre un controllo più fine mantenendo al contempo la facilità d'uso. Il nostro framework affronta sfide chiave, come la modellazione di interazioni complesse tra ciocche e pattern di schizzi variabili, attraverso due principali innovazioni: una strategia di upsampling apprendibile delle ciocche che codifica le ciocche 3D in spazi latenti multi-scala, e un meccanismo di condizionamento adattivo multi-scala che utilizza un transformer con teste di diffusione per garantire coerenza tra i livelli di granularità. Esperimenti su diversi dataset di benchmark dimostrano che il nostro metodo supera gli approcci esistenti in termini di realismo e precisione. I risultati qualitativi ne confermano ulteriormente l'efficacia. Il codice sarà rilasciato su [GitHub](https://github.com/fighting-Zhang/StrandDesigner).
English
Realistic hair strand generation is crucial for applications like computer graphics and virtual reality. While diffusion models can generate hairstyles from text or images, these inputs lack precision and user-friendliness. Instead, we propose the first sketch-based strand generation model, which offers finer control while remaining user-friendly. Our framework tackles key challenges, such as modeling complex strand interactions and diverse sketch patterns, through two main innovations: a learnable strand upsampling strategy that encodes 3D strands into multi-scale latent spaces, and a multi-scale adaptive conditioning mechanism using a transformer with diffusion heads to ensure consistency across granularity levels. Experiments on several benchmark datasets show our method outperforms existing approaches in realism and precision. Qualitative results further confirm its effectiveness. Code will be released at [GitHub](https://github.com/fighting-Zhang/StrandDesigner).
PDF63August 8, 2025