OverLayBench: Ein Benchmark für die Layout-zu-Bild-Generierung mit dichten Überlappungen
OverLayBench: A Benchmark for Layout-to-Image Generation with Dense Overlaps
September 23, 2025
papers.authors: Bingnan Li, Chen-Yu Wang, Haiyang Xu, Xiang Zhang, Ethan Armand, Divyansh Srivastava, Xiaojun Shan, Zeyuan Chen, Jianwen Xie, Zhuowen Tu
cs.AI
papers.abstract
Trotz stetiger Fortschritte in der Layout-zu-Bild-Generierung haben aktuelle Methoden nach wie vor Schwierigkeiten mit Layouts, die signifikante Überlappungen zwischen Begrenzungsrahmen aufweisen. Wir identifizieren zwei Hauptherausforderungen: (1) große überlappende Regionen und (2) überlappende Instanzen mit minimaler semantischer Unterscheidung. Anhand qualitativer Beispiele und quantitativer Analysen zeigen wir, wie diese Faktoren die Generierungsqualität beeinträchtigen. Um dieses Problem systematisch zu bewerten, führen wir OverLayScore ein, eine neuartige Metrik, die die Komplexität überlappender Begrenzungsrahmen quantifiziert. Unsere Analyse zeigt, dass bestehende Benchmarks auf einfachere Fälle mit niedrigen OverLayScore-Werten ausgerichtet sind, was ihre Wirksamkeit bei der Bewertung der Modellleistung unter anspruchsvolleren Bedingungen einschränkt. Um diese Lücke zu schließen, präsentieren wir OverLayBench, einen neuen Benchmark mit hochwertigen Annotationen und einer ausgewogenen Verteilung über verschiedene OverLayScore-Niveaus hinweg. Als ersten Schritt zur Verbesserung der Leistung bei komplexen Überlappungen schlagen wir auch CreatiLayout-AM vor, ein Modell, das auf einem kuratierten amodalen Masken-Datensatz feinabgestimmt wurde. Zusammen legen unsere Beiträge den Grundstein für eine robustere Layout-zu-Bild-Generierung unter realistischen und anspruchsvollen Szenarien. Projektlink: https://mlpc-ucsd.github.io/OverLayBench.
English
Despite steady progress in layout-to-image generation, current methods still
struggle with layouts containing significant overlap between bounding boxes. We
identify two primary challenges: (1) large overlapping regions and (2)
overlapping instances with minimal semantic distinction. Through both
qualitative examples and quantitative analysis, we demonstrate how these
factors degrade generation quality. To systematically assess this issue, we
introduce OverLayScore, a novel metric that quantifies the complexity of
overlapping bounding boxes. Our analysis reveals that existing benchmarks are
biased toward simpler cases with low OverLayScore values, limiting their
effectiveness in evaluating model performance under more challenging
conditions. To bridge this gap, we present OverLayBench, a new benchmark
featuring high-quality annotations and a balanced distribution across different
levels of OverLayScore. As an initial step toward improving performance on
complex overlaps, we also propose CreatiLayout-AM, a model fine-tuned on a
curated amodal mask dataset. Together, our contributions lay the groundwork for
more robust layout-to-image generation under realistic and challenging
scenarios. Project link: https://mlpc-ucsd.github.io/OverLayBench.