Loomis Painter: 회화 과정 재구성하기
Loomis Painter: Reconstructing the Painting Process
November 21, 2025
저자: Markus Pobitzer, Chang Liu, Chenyi Zhuang, Teng Long, Bin Ren, Nicu Sebe
cs.AI
초록
단계별 그림 튜토리얼은 예술 기법 학습에 필수적이지만, 기존 동영상 자료(예: YouTube)는 상호작용성과 개인화가 부족합니다. 최근 생성 모델은 예술적 이미지 합성에서 진전을 이루었으나, 다양한 매체 간 일반화에 어려움을 겪으며 시간적 또는 구조적 불일치를 보여 인간의 창작 워크플로우를 충실히 재현하는 데 방해가 됩니다. 이를 해결하기 위해 우리는 의미론 기반 스타일 제어 메커니즘을 통한 다매체 그림 과정 생성 통합 프레임워크를 제안합니다. 이는 여러 매체를 확산 모델의 조건 공간에 임베딩하고 교차 매체 스타일 증강을 사용하여 스타일 간 일관된 텍스처 진화와 과정 전이를 가능하게 합니다. 역방향 그림 학습 전략은 더욱 부드럽고 인간과 조화된 생성을 보장합니다. 또한 실제 그림 과정 대규모 데이터셋을 구축하고 교차 매체 일관성, 시간적 일관성, 최종 이미지 정확도를 평가하여 LPIPS, DINO, CLIP 메트릭에서 우수한 결과를 달성했습니다. 마지막으로, 우리의 지각 거리 프로파일(PDP) 곡선은 구성, 색상 배치, 디테일 정교화라는 창작 순서를 정량적으로 모델링하여 인간의 예술적 진행 과정을 반영합니다.
English
Step-by-step painting tutorials are vital for learning artistic techniques, but existing video resources (e.g., YouTube) lack interactivity and personalization. While recent generative models have advanced artistic image synthesis, they struggle to generalize across media and often show temporal or structural inconsistencies, hindering faithful reproduction of human creative workflows. To address this, we propose a unified framework for multi-media painting process generation with a semantics-driven style control mechanism that embeds multiple media into a diffusion models conditional space and uses cross-medium style augmentation. This enables consistent texture evolution and process transfer across styles. A reverse-painting training strategy further ensures smooth, human-aligned generation. We also build a large-scale dataset of real painting processes and evaluate cross-media consistency, temporal coherence, and final-image fidelity, achieving strong results on LPIPS, DINO, and CLIP metrics. Finally, our Perceptual Distance Profile (PDP) curve quantitatively models the creative sequence, i.e., composition, color blocking, and detail refinement, mirroring human artistic progression.