ChatPaper.aiChatPaper

OverLayBench : Un Benchmark pour la Génération d'Images à partir de Mises en Page avec Chevauchements Denses

OverLayBench: A Benchmark for Layout-to-Image Generation with Dense Overlaps

September 23, 2025
papers.authors: Bingnan Li, Chen-Yu Wang, Haiyang Xu, Xiang Zhang, Ethan Armand, Divyansh Srivastava, Xiaojun Shan, Zeyuan Chen, Jianwen Xie, Zhuowen Tu
cs.AI

papers.abstract

Malgré des progrès constants dans la génération d'images à partir de mises en page, les méthodes actuelles rencontrent encore des difficultés avec les mises en page contenant des chevauchements significatifs entre les boîtes englobantes. Nous identifions deux défis principaux : (1) les grandes zones de chevauchement et (2) les instances se chevauchant avec une distinction sémantique minimale. À travers des exemples qualitatifs et une analyse quantitative, nous démontrons comment ces facteurs dégradent la qualité de la génération. Pour évaluer systématiquement ce problème, nous introduisons OverLayScore, une nouvelle métrique qui quantifie la complexité des boîtes englobantes qui se chevauchent. Notre analyse révèle que les benchmarks existants sont biaisés en faveur de cas plus simples avec des valeurs d'OverLayScore faibles, limitant leur efficacité pour évaluer les performances des modèles dans des conditions plus difficiles. Pour combler cette lacune, nous présentons OverLayBench, un nouveau benchmark comportant des annotations de haute qualité et une distribution équilibrée à travers différents niveaux d'OverLayScore. Comme première étape vers l'amélioration des performances sur les chevauchements complexes, nous proposons également CreatiLayout-AM, un modèle affiné sur un ensemble de données de masques amodaux soigneusement sélectionné. Ensemble, nos contributions posent les bases d'une génération d'images à partir de mises en page plus robuste dans des scénarios réalistes et difficiles. Lien du projet : https://mlpc-ucsd.github.io/OverLayBench.
English
Despite steady progress in layout-to-image generation, current methods still struggle with layouts containing significant overlap between bounding boxes. We identify two primary challenges: (1) large overlapping regions and (2) overlapping instances with minimal semantic distinction. Through both qualitative examples and quantitative analysis, we demonstrate how these factors degrade generation quality. To systematically assess this issue, we introduce OverLayScore, a novel metric that quantifies the complexity of overlapping bounding boxes. Our analysis reveals that existing benchmarks are biased toward simpler cases with low OverLayScore values, limiting their effectiveness in evaluating model performance under more challenging conditions. To bridge this gap, we present OverLayBench, a new benchmark featuring high-quality annotations and a balanced distribution across different levels of OverLayScore. As an initial step toward improving performance on complex overlaps, we also propose CreatiLayout-AM, a model fine-tuned on a curated amodal mask dataset. Together, our contributions lay the groundwork for more robust layout-to-image generation under realistic and challenging scenarios. Project link: https://mlpc-ucsd.github.io/OverLayBench.
PDF52September 26, 2025