Matting par Génération
Matting by Generation
July 30, 2024
Auteurs: Zhixiang Wang, Baiang Li, Jian Wang, Yu-Lun Liu, Jinwei Gu, Yung-Yu Chuang, Shin'ichi Satoh
cs.AI
Résumé
Cet article présente une approche innovante pour l'extraction d'images qui redéfinit la tâche traditionnelle basée sur la régression en un défi de modélisation générative. Notre méthode exploite les capacités des modèles de diffusion latente, enrichis par des connaissances pré-entraînées étendues, pour régulariser le processus d'extraction. Nous introduisons des innovations architecturales novatrices qui permettent à notre modèle de produire des masques avec une résolution et un niveau de détail supérieurs. La méthode proposée est polyvalente et peut réaliser à la fois une extraction d'images sans guidage et avec guidage, s'adaptant à une variété d'indices supplémentaires. Notre évaluation exhaustive sur trois ensembles de données de référence démontre la performance supérieure de notre approche, tant sur le plan quantitatif que qualitatif. Les résultats reflètent non seulement l'efficacité robuste de notre méthode, mais mettent également en lumière sa capacité à générer des masques visuellement convaincants qui approchent la qualité photoréaliste. La page du projet pour cet article est disponible à l'adresse suivante : https://lightchaserx.github.io/matting-by-generation/
English
This paper introduces an innovative approach for image matting that redefines
the traditional regression-based task as a generative modeling challenge. Our
method harnesses the capabilities of latent diffusion models, enriched with
extensive pre-trained knowledge, to regularize the matting process. We present
novel architectural innovations that empower our model to produce mattes with
superior resolution and detail. The proposed method is versatile and can
perform both guidance-free and guidance-based image matting, accommodating a
variety of additional cues. Our comprehensive evaluation across three benchmark
datasets demonstrates the superior performance of our approach, both
quantitatively and qualitatively. The results not only reflect our method's
robust effectiveness but also highlight its ability to generate visually
compelling mattes that approach photorealistic quality. The project page for
this paper is available at
https://lightchaserx.github.io/matting-by-generation/Summary
AI-Generated Summary