Следуйте-за-холстом: Восстановление изображений высокого разрешения в видео с обширной генерацией контента
Follow-Your-Canvas: Higher-Resolution Video Outpainting with Extensive Content Generation
September 2, 2024
Авторы: Qihua Chen, Yue Ma, Hongfa Wang, Junkun Yuan, Wenzhe Zhao, Qi Tian, Hongmei Wang, Shaobo Min, Qifeng Chen, Wei Liu
cs.AI
Аннотация
Данная статья исследует увеличение разрешения видео с обширной генерацией контента. Мы выявляем распространенные проблемы, с которыми сталкиваются существующие методы при попытках значительно увеличить видео: генерация контента низкого качества и ограничения, накладываемые памятью GPU. Для решения этих проблем мы предлагаем метод на основе диффузии под названием Follow-Your-Canvas. Он основан на двух основных концепциях. Во-первых, вместо применения распространенной практики "одноразового" увеличения видео, мы распределяем задачу по пространственным окнам и плавно объединяем их. Это позволяет нам увеличивать видео любого размера и разрешения без ограничений памятью GPU. Во-вторых, исходное видео и его относительное пространственное положение вводятся в процесс генерации каждого окна. Это позволяет сгенерированной пространственной композиции в каждом окне гармонировать с исходным видео. Сочетание этих двух концепций позволяет нам генерировать видео с увеличенным разрешением с богатым контентом, сохраняя пространственную и временную согласованность. Follow-Your-Canvas превосходит в увеличении видео крупного масштаба, например, с 512X512 до 1152X2048 (9X), обеспечивая высококачественные и эстетически приятные результаты. Он достигает лучших количественных результатов при различных настройках разрешения и масштаба. Код доступен по ссылке https://github.com/mayuelala/FollowYourCanvas
English
This paper explores higher-resolution video outpainting with extensive
content generation. We point out common issues faced by existing methods when
attempting to largely outpaint videos: the generation of low-quality content
and limitations imposed by GPU memory. To address these challenges, we propose
a diffusion-based method called Follow-Your-Canvas. It builds upon two
core designs. First, instead of employing the common practice of "single-shot"
outpainting, we distribute the task across spatial windows and seamlessly merge
them. It allows us to outpaint videos of any size and resolution without being
constrained by GPU memory. Second, the source video and its relative positional
relation are injected into the generation process of each window. It makes the
generated spatial layout within each window harmonize with the source video.
Coupling with these two designs enables us to generate higher-resolution
outpainting videos with rich content while keeping spatial and temporal
consistency. Follow-Your-Canvas excels in large-scale video outpainting, e.g.,
from 512X512 to 1152X2048 (9X), while producing high-quality and aesthetically
pleasing results. It achieves the best quantitative results across various
resolution and scale setups. The code is released on
https://github.com/mayuelala/FollowYourCanvasSummary
AI-Generated Summary