ColorFlow: Поиск с поддержкой извлечения цвета последовательности изображений

Аннотация

Автоматическое окрашивание черно-белой последовательности изображений с сохранением характера и идентификации объектов является сложной задачей с высоким спросом на рынке, например, в окрашивании мультфильмов или комиксов. Несмотря на прогресс в визуальном окрашивании с использованием масштабных генеративных моделей, таких как модели диффузии, остаются проблемы с управляемостью и согласованностью идентификации, что делает текущие решения непригодными для промышленного применения. Для решения этой проблемы мы предлагаем ColorFlow, трехэтапную диффузионную структуру, специально разработанную для окрашивания последовательности изображений в промышленных приложениях. В отличие от существующих методов, требующих настройки под каждую идентификацию или явное извлечение встроенной идентификации, мы предлагаем новый надежный и обобщенный конвейер для окрашивания с помощью поискового усиления. Наш конвейер также имеет двухветвевую конструкцию: одна ветвь для извлечения цветовой идентичности и другая для окрашивания, используя преимущества моделей диффузии. Мы используем механизм самовнимания в моделях диффузии для эффективного контекстного обучения и сопоставления цветовой идентичности. Для оценки нашей модели мы представляем ColorFlow-Bench, обширный набор тестов для окрашивания на основе ссылок. Результаты показывают, что ColorFlow превосходит существующие модели по нескольким метрикам, устанавливая новый стандарт в последовательном окрашивании изображений и потенциально принося пользу индустрии искусства. Мы публикуем наши коды и модели на странице нашего проекта: https://zhuang2002.github.io/ColorFlow/.

English

Automatic black-and-white image sequence colorization while preserving character and object identity (ID) is a complex task with significant market demand, such as in cartoon or comic series colorization. Despite advancements in visual colorization using large-scale generative models like diffusion models, challenges with controllability and identity consistency persist, making current solutions unsuitable for industrial application.To address this, we propose ColorFlow, a three-stage diffusion-based framework tailored for image sequence colorization in industrial applications. Unlike existing methods that require per-ID finetuning or explicit ID embedding extraction, we propose a novel robust and generalizable Retrieval Augmented Colorization pipeline for colorizing images with relevant color references. Our pipeline also features a dual-branch design: one branch for color identity extraction and the other for colorization, leveraging the strengths of diffusion models. We utilize the self-attention mechanism in diffusion models for strong in-context learning and color identity matching. To evaluate our model, we introduce ColorFlow-Bench, a comprehensive benchmark for reference-based colorization. Results show that ColorFlow outperforms existing models across multiple metrics, setting a new standard in sequential image colorization and potentially benefiting the art industry. We release our codes and models on our project page: https://zhuang2002.github.io/ColorFlow/.

ColorFlow: Поиск с поддержкой извлечения цвета последовательности изображений

ColorFlow: Retrieval-Augmented Image Sequence Colorization

Аннотация

Support