ChatPaper.aiChatPaper

OverLayBench: Un punto de referencia para la generación de imágenes a partir de diseños con superposiciones densas

OverLayBench: A Benchmark for Layout-to-Image Generation with Dense Overlaps

September 23, 2025
Autores: Bingnan Li, Chen-Yu Wang, Haiyang Xu, Xiang Zhang, Ethan Armand, Divyansh Srivastava, Xiaojun Shan, Zeyuan Chen, Jianwen Xie, Zhuowen Tu
cs.AI

Resumen

A pesar de los avances constantes en la generación de imágenes a partir de diseños, los métodos actuales aún enfrentan dificultades con diseños que contienen superposiciones significativas entre cuadros delimitadores. Identificamos dos desafíos principales: (1) regiones de superposición extensas y (2) instancias superpuestas con distinción semántica mínima. A través de ejemplos cualitativos y análisis cuantitativo, demostramos cómo estos factores degradan la calidad de la generación. Para evaluar sistemáticamente este problema, introducimos OverLayScore, una métrica novedosa que cuantifica la complejidad de los cuadros delimitadores superpuestos. Nuestro análisis revela que los puntos de referencia existentes están sesgados hacia casos más simples con valores bajos de OverLayScore, lo que limita su eficacia para evaluar el rendimiento de los modelos en condiciones más desafiantes. Para cerrar esta brecha, presentamos OverLayBench, un nuevo punto de referencia que incluye anotaciones de alta calidad y una distribución equilibrada en diferentes niveles de OverLayScore. Como un primer paso hacia la mejora del rendimiento en superposiciones complejas, también proponemos CreatiLayout-AM, un modelo ajustado en un conjunto de datos de máscaras amodales curadas. En conjunto, nuestras contribuciones sientan las bases para una generación más robusta de imágenes a partir de diseños en escenarios realistas y desafiantes. Enlace del proyecto: https://mlpc-ucsd.github.io/OverLayBench.
English
Despite steady progress in layout-to-image generation, current methods still struggle with layouts containing significant overlap between bounding boxes. We identify two primary challenges: (1) large overlapping regions and (2) overlapping instances with minimal semantic distinction. Through both qualitative examples and quantitative analysis, we demonstrate how these factors degrade generation quality. To systematically assess this issue, we introduce OverLayScore, a novel metric that quantifies the complexity of overlapping bounding boxes. Our analysis reveals that existing benchmarks are biased toward simpler cases with low OverLayScore values, limiting their effectiveness in evaluating model performance under more challenging conditions. To bridge this gap, we present OverLayBench, a new benchmark featuring high-quality annotations and a balanced distribution across different levels of OverLayScore. As an initial step toward improving performance on complex overlaps, we also propose CreatiLayout-AM, a model fine-tuned on a curated amodal mask dataset. Together, our contributions lay the groundwork for more robust layout-to-image generation under realistic and challenging scenarios. Project link: https://mlpc-ucsd.github.io/OverLayBench.
PDF52September 26, 2025