ChatPaper.aiChatPaper

Улучшение изображения: генерация изображений высокого качества с использованием моделей диффузии в пространстве пикселей Лапласа.

Edify Image: High-Quality Image Generation with Pixel Space Laplacian Diffusion Models

November 11, 2024
Авторы: NVIDIA, Yuval Atzmon, Maciej Bala, Yogesh Balaji, Tiffany Cai, Yin Cui, Jiaojiao Fan, Yunhao Ge, Siddharth Gururani, Jacob Huffman, Ronald Isaac, Pooya Jannaty, Tero Karras, Grace Lam, J. P. Lewis, Aaron Licata, Yen-Chen Lin, Ming-Yu Liu, Qianli Ma, Arun Mallya, Ashlee Martino-Tarr, Doug Mendez, Seungjun Nah, Chris Pruett, Fitsum Reda, Jiaming Song, Ting-Chun Wang, Fangyin Wei, Xiaohui Zeng, Yu Zeng, Qinsheng Zhang
cs.AI

Аннотация

Мы представляем Edify Image, семейство моделей диффузии, способных генерировать фотореалистичный контент изображений с пиксельной точностью. Edify Image использует каскадные модели диффузии в пространстве пикселей, обученные с использованием нового процесса лапласовской диффузии, в котором сигналы изображения на различных частотных полосах ослабляются с разной скоростью. Edify Image поддерживает широкий спектр приложений, включая синтез текста в изображение, увеличение разрешения до 4K, ControlNets, генерацию 360 HDR-панорам и настройку для индивидуальной настройки изображения.
English
We introduce Edify Image, a family of diffusion models capable of generating photorealistic image content with pixel-perfect accuracy. Edify Image utilizes cascaded pixel-space diffusion models trained using a novel Laplacian diffusion process, in which image signals at different frequency bands are attenuated at varying rates. Edify Image supports a wide range of applications, including text-to-image synthesis, 4K upsampling, ControlNets, 360 HDR panorama generation, and finetuning for image customization.

Summary

AI-Generated Summary

PDF315November 12, 2024