ChatPaper.aiChatPaper

StrandDesigner: Hacia la generación práctica de hebras con guía de bocetos

StrandDesigner: Towards Practical Strand Generation with Sketch Guidance

August 3, 2025
Autores: Na Zhang, Moran Li, Chengming Xu, Han Feng, Xiaobin Hu, Jiangning Zhang, Weijian Cao, Chengjie Wang, Yanwei Fu
cs.AI

Resumen

La generación realista de hebras de cabello es crucial para aplicaciones como gráficos por computadora y realidad virtual. Si bien los modelos de difusión pueden generar peinados a partir de texto o imágenes, estas entradas carecen de precisión y facilidad de uso. En su lugar, proponemos el primer modelo de generación de hebras basado en bocetos, que ofrece un control más fino mientras mantiene la facilidad de uso. Nuestro marco aborda desafíos clave, como modelar interacciones complejas entre hebras y diversos patrones de bocetos, a través de dos innovaciones principales: una estrategia de aumento de resolución de hebras aprendible que codifica hebras 3D en espacios latentes multi-escala, y un mecanismo de condicionamiento adaptativo multi-escala que utiliza un transformador con cabezales de difusión para garantizar consistencia entre niveles de granularidad. Los experimentos en varios conjuntos de datos de referencia muestran que nuestro método supera a los enfoques existentes en realismo y precisión. Los resultados cualitativos confirman aún más su efectividad. El código se publicará en [GitHub](https://github.com/fighting-Zhang/StrandDesigner).
English
Realistic hair strand generation is crucial for applications like computer graphics and virtual reality. While diffusion models can generate hairstyles from text or images, these inputs lack precision and user-friendliness. Instead, we propose the first sketch-based strand generation model, which offers finer control while remaining user-friendly. Our framework tackles key challenges, such as modeling complex strand interactions and diverse sketch patterns, through two main innovations: a learnable strand upsampling strategy that encodes 3D strands into multi-scale latent spaces, and a multi-scale adaptive conditioning mechanism using a transformer with diffusion heads to ensure consistency across granularity levels. Experiments on several benchmark datasets show our method outperforms existing approaches in realism and precision. Qualitative results further confirm its effectiveness. Code will be released at [GitHub](https://github.com/fighting-Zhang/StrandDesigner).
PDF63August 8, 2025