ChatPaper.aiChatPaper

ルーミス・ペインター:絵画プロセスの再構築

Loomis Painter: Reconstructing the Painting Process

November 21, 2025
著者: Markus Pobitzer, Chang Liu, Chenyi Zhuang, Teng Long, Bin Ren, Nicu Sebe
cs.AI

要旨

ステップバイステップの絵画チュートリアルは芸術的技法の習得に不可欠ですが、既存の動画リソース(例:YouTube)には双方向性と個人化が不足しています。近年の生成モデルは芸術的画像合成において進歩を遂げていますが、媒体間の汎化が困難で、時間的または構造的な不整合が生じやすく、人間の創造的ワークフローの正確な再現を妨げています。この課題に対処するため、我々は複数媒体を拡散モデルの条件付き空間に埋め込み、媒体横断的スタイル拡張を活用する意味論駆動のスタイル制御機構を備えた、マルチメディア絵画プロセス生成の統一フレームワークを提案します。これにより、一貫した質感の進化とスタイル横断的なプロセス転移が可能となります。逆方向描画トレーニング戦略により、滑らかで人間の創作過程に沿った生成をさらに保証します。また、実写の絵画プロセスからなる大規模データセットを構築し、媒体横断的一貫性、時間的連続性、最終画像の忠実度を評価し、LPIPS、DINO、CLIP指標において優れた結果を達成しました。最後に、知覚距離プロファイル(PDP)曲線を用いて、構図決定、色面分割、細部仕上げといった創造的作業序列を定量的にモデル化し、人間の芸術的進行を反映させることに成功しました。
English
Step-by-step painting tutorials are vital for learning artistic techniques, but existing video resources (e.g., YouTube) lack interactivity and personalization. While recent generative models have advanced artistic image synthesis, they struggle to generalize across media and often show temporal or structural inconsistencies, hindering faithful reproduction of human creative workflows. To address this, we propose a unified framework for multi-media painting process generation with a semantics-driven style control mechanism that embeds multiple media into a diffusion models conditional space and uses cross-medium style augmentation. This enables consistent texture evolution and process transfer across styles. A reverse-painting training strategy further ensures smooth, human-aligned generation. We also build a large-scale dataset of real painting processes and evaluate cross-media consistency, temporal coherence, and final-image fidelity, achieving strong results on LPIPS, DINO, and CLIP metrics. Finally, our Perceptual Distance Profile (PDP) curve quantitatively models the creative sequence, i.e., composition, color blocking, and detail refinement, mirroring human artistic progression.
PDF152December 1, 2025