Следуйте-за-холстом: Восстановление изображений высокого разрешения в видео с обширной генерацией контента

Аннотация

Данная статья исследует увеличение разрешения видео с обширной генерацией контента. Мы выявляем распространенные проблемы, с которыми сталкиваются существующие методы при попытках значительно увеличить видео: генерация контента низкого качества и ограничения, накладываемые памятью GPU. Для решения этих проблем мы предлагаем метод на основе диффузии под названием Follow-Your-Canvas. Он основан на двух основных концепциях. Во-первых, вместо применения распространенной практики "одноразового" увеличения видео, мы распределяем задачу по пространственным окнам и плавно объединяем их. Это позволяет нам увеличивать видео любого размера и разрешения без ограничений памятью GPU. Во-вторых, исходное видео и его относительное пространственное положение вводятся в процесс генерации каждого окна. Это позволяет сгенерированной пространственной композиции в каждом окне гармонировать с исходным видео. Сочетание этих двух концепций позволяет нам генерировать видео с увеличенным разрешением с богатым контентом, сохраняя пространственную и временную согласованность. Follow-Your-Canvas превосходит в увеличении видео крупного масштаба, например, с 512X512 до 1152X2048 (9X), обеспечивая высококачественные и эстетически приятные результаты. Он достигает лучших количественных результатов при различных настройках разрешения и масштаба. Код доступен по ссылке https://github.com/mayuelala/FollowYourCanvas

English

This paper explores higher-resolution video outpainting with extensive content generation. We point out common issues faced by existing methods when attempting to largely outpaint videos: the generation of low-quality content and limitations imposed by GPU memory. To address these challenges, we propose a diffusion-based method called Follow-Your-Canvas. It builds upon two core designs. First, instead of employing the common practice of "single-shot" outpainting, we distribute the task across spatial windows and seamlessly merge them. It allows us to outpaint videos of any size and resolution without being constrained by GPU memory. Second, the source video and its relative positional relation are injected into the generation process of each window. It makes the generated spatial layout within each window harmonize with the source video. Coupling with these two designs enables us to generate higher-resolution outpainting videos with rich content while keeping spatial and temporal consistency. Follow-Your-Canvas excels in large-scale video outpainting, e.g., from 512X512 to 1152X2048 (9X), while producing high-quality and aesthetically pleasing results. It achieves the best quantitative results across various resolution and scale setups. The code is released on https://github.com/mayuelala/FollowYourCanvas

Следуйте-за-холстом: Восстановление изображений высокого разрешения в видео с обширной генерацией контента

Follow-Your-Canvas: Higher-Resolution Video Outpainting with Extensive Content Generation

Аннотация

Support