Cobra:広範な参照を活用した効率的な線画彩色
Cobra: Efficient Line Art COlorization with BRoAder References
April 16, 2025
著者: Junhao Zhuang, Lingen Li, Xuan Ju, Zhaoyang Zhang, Chun Yuan, Ying Shan
cs.AI
要旨
漫画制作業界では、高精度で効率的、文脈的一貫性があり、柔軟な制御が可能な参照ベースの線画彩色が求められています。漫画の1ページには多様なキャラクター、物体、背景が含まれるため、彩色プロセスは複雑になります。画像生成における拡散モデルの進展にもかかわらず、線画彩色への応用は限られており、大量の参照画像の処理、時間のかかる推論、柔軟な制御に関する課題に直面しています。本研究では、線画彩色の品質に対する広範な文脈的画像ガイダンスの必要性を調査します。これらの課題に対処するため、我々はCobraを提案します。これは、カラーヒントをサポートし、200枚以上の参照画像を利用しながら低遅延を維持する効率的で汎用的な手法です。Cobraの中核となるのはCausal Sparse DiTアーキテクチャで、特別に設計された位置エンコーディング、因果的スパースアテンション、Key-Value Cacheを活用して、長文脈の参照を効果的に管理し、色の同一性を保証します。結果は、Cobraが広範な文脈的参照を通じて正確な線画彩色を実現し、推論速度とインタラクティブ性を大幅に向上させ、重要な産業ニーズを満たすことを示しています。コードとモデルはプロジェクトページ(https://zhuang2002.github.io/Cobra/)で公開しています。
English
The comic production industry requires reference-based line art colorization
with high accuracy, efficiency, contextual consistency, and flexible control. A
comic page often involves diverse characters, objects, and backgrounds, which
complicates the coloring process. Despite advancements in diffusion models for
image generation, their application in line art colorization remains limited,
facing challenges related to handling extensive reference images,
time-consuming inference, and flexible control. We investigate the necessity of
extensive contextual image guidance on the quality of line art colorization. To
address these challenges, we introduce Cobra, an efficient and versatile method
that supports color hints and utilizes over 200 reference images while
maintaining low latency. Central to Cobra is a Causal Sparse DiT architecture,
which leverages specially designed positional encodings, causal sparse
attention, and Key-Value Cache to effectively manage long-context references
and ensure color identity consistency. Results demonstrate that Cobra achieves
accurate line art colorization through extensive contextual reference,
significantly enhancing inference speed and interactivity, thereby meeting
critical industrial demands. We release our codes and models on our project
page: https://zhuang2002.github.io/Cobra/.