ChatPaper.aiChatPaper

Pintor Loomis: Reconstruindo o Processo de Pintura

Loomis Painter: Reconstructing the Painting Process

November 21, 2025
Autores: Markus Pobitzer, Chang Liu, Chenyi Zhuang, Teng Long, Bin Ren, Nicu Sebe
cs.AI

Resumo

Os tutoriais de pintura passo a passo são fundamentais para o aprendizado de técnicas artísticas, mas os recursos em vídeo existentes (como o YouTube) carecem de interatividade e personalização. Embora os modelos generativos recentes tenham avançado na síntese de imagens artísticas, eles lutam para generalizar entre diferentes mídias e frequentemente apresentam inconsistências temporais ou estruturais, dificultando a reprodução fiel dos fluxos de trabalho criativos humanos. Para resolver isso, propomos uma estrutura unificada para a geração de processos de pintura em multimídia com um mecanismo de controle de estilo orientado por semântica que incorpora múltiplas mídias no espaço condicional de modelos de difusão e utiliza aumento de estilo entre mídias. Isso permite uma evolução de textura consistente e transferência de processo entre estilos. Uma estratégia de treinamento por pintura reversa garante ainda mais uma geração suave e alinhada com o processo humano. Também construímos um conjunto de dados em larga escala de processos de pintura reais e avaliamos a consistência entre mídias, a coerência temporal e a fidelidade da imagem final, alcançando resultados sólidos nas métricas LPIPS, DINO e CLIP. Por fim, nossa curva de Perfil de Distância Perceptual (PDP) modela quantitativamente a sequência criativa - composição, bloqueio de cores e refinamento de detalhes - espelhando a progressão artística humana.
English
Step-by-step painting tutorials are vital for learning artistic techniques, but existing video resources (e.g., YouTube) lack interactivity and personalization. While recent generative models have advanced artistic image synthesis, they struggle to generalize across media and often show temporal or structural inconsistencies, hindering faithful reproduction of human creative workflows. To address this, we propose a unified framework for multi-media painting process generation with a semantics-driven style control mechanism that embeds multiple media into a diffusion models conditional space and uses cross-medium style augmentation. This enables consistent texture evolution and process transfer across styles. A reverse-painting training strategy further ensures smooth, human-aligned generation. We also build a large-scale dataset of real painting processes and evaluate cross-media consistency, temporal coherence, and final-image fidelity, achieving strong results on LPIPS, DINO, and CLIP metrics. Finally, our Perceptual Distance Profile (PDP) curve quantitatively models the creative sequence, i.e., composition, color blocking, and detail refinement, mirroring human artistic progression.
PDF152February 27, 2026