ChatPaper.aiChatPaper

Pintor de Loomis: Reconstruyendo el Proceso Pictórico

Loomis Painter: Reconstructing the Painting Process

November 21, 2025
Autores: Markus Pobitzer, Chang Liu, Chenyi Zhuang, Teng Long, Bin Ren, Nicu Sebe
cs.AI

Resumen

Los tutoriales de pintura paso a paso son fundamentales para aprender técnicas artísticas, pero los recursos de video existentes (por ejemplo, YouTube) carecen de interactividad y personalización. Si bien los modelos generativos recientes han avanzado en la síntesis de imágenes artísticas, tienen dificultades para generalizar entre diferentes medios y a menudo muestran inconsistencias temporales o estructurales, lo que impide la reproducción fiel de los flujos de trabajo creativos humanos. Para abordar esto, proponemos un marco unificado para la generación de procesos de pintura en múltiples medios con un mecanismo de control de estilo impulsado por la semántica que incrusta múltiples medios en el espacio condicional de modelos de difusión y utiliza una aumentación de estilo intermedios. Esto permite una evolución de textura consistente y una transferencia de proceso entre estilos. Una estrategia de entrenamiento de pintura inversa asegura además una generación fluida y alineada con el proceso humano. También construimos un conjunto de datos a gran escala de procesos de pintura reales y evaluamos la consistencia intermedios, la coherencia temporal y la fidelidad de la imagen final, logrando resultados sólidos en las métricas LPIPS, DINO y CLIP. Finalmente, nuestra curva de Perfil de Distancia Perceptual (PDP) modela cuantitativamente la secuencia creativa, es decir, la composición, el bloqueo de color y el refinamiento de detalles, reflejando la progresión artística humana.
English
Step-by-step painting tutorials are vital for learning artistic techniques, but existing video resources (e.g., YouTube) lack interactivity and personalization. While recent generative models have advanced artistic image synthesis, they struggle to generalize across media and often show temporal or structural inconsistencies, hindering faithful reproduction of human creative workflows. To address this, we propose a unified framework for multi-media painting process generation with a semantics-driven style control mechanism that embeds multiple media into a diffusion models conditional space and uses cross-medium style augmentation. This enables consistent texture evolution and process transfer across styles. A reverse-painting training strategy further ensures smooth, human-aligned generation. We also build a large-scale dataset of real painting processes and evaluate cross-media consistency, temporal coherence, and final-image fidelity, achieving strong results on LPIPS, DINO, and CLIP metrics. Finally, our Perceptual Distance Profile (PDP) curve quantitatively models the creative sequence, i.e., composition, color blocking, and detail refinement, mirroring human artistic progression.
PDF152December 1, 2025