ChatPaper.aiChatPaper

OverLayBench: 밀집된 겹침을 포함한 레이아웃-이미지 생성을 위한 벤치마크

OverLayBench: A Benchmark for Layout-to-Image Generation with Dense Overlaps

September 23, 2025
저자: Bingnan Li, Chen-Yu Wang, Haiyang Xu, Xiang Zhang, Ethan Armand, Divyansh Srivastava, Xiaojun Shan, Zeyuan Chen, Jianwen Xie, Zhuowen Tu
cs.AI

초록

레이아웃-이미지 생성 분야에서 꾸준한 발전이 이루어졌음에도 불구하고, 현재의 방법들은 여전히 바운딩 박스 간의 상당한 중첩이 포함된 레이아웃에서 어려움을 겪고 있습니다. 우리는 두 가지 주요 과제를 확인했습니다: (1) 큰 중첩 영역과 (2) 의미론적 구분이 거의 없는 중첩 인스턴스입니다. 질적 사례와 정량적 분석을 통해 이러한 요소들이 생성 품질을 저하시키는 방식을 입증했습니다. 이 문제를 체계적으로 평가하기 위해, 우리는 중첩 바운딩 박스의 복잡성을 수치화하는 새로운 지표인 OverLayScore를 도입했습니다. 우리의 분석은 기존 벤치마크가 낮은 OverLayScore 값을 가진 단순한 경우에 편향되어 있어, 더 어려운 조건에서의 모델 성능 평가에 한계가 있음을 보여줍니다. 이러한 격차를 해소하기 위해, 우리는 고품질 주석과 다양한 OverLayScore 수준에 걸친 균형 잡힌 분포를 특징으로 하는 새로운 벤치마크인 OverLayBench를 제시합니다. 또한, 복잡한 중첩에서의 성능 향상을 위한 초기 단계로, 우리는 선별된 아모달 마스크 데이터셋에서 미세 조정된 모델인 CreatiLayout-AM을 제안합니다. 우리의 공헌은 현실적이고 도전적인 시나리오에서 더 견고한 레이아웃-이미지 생성을 위한 기반을 마련합니다. 프로젝트 링크: https://mlpc-ucsd.github.io/OverLayBench.
English
Despite steady progress in layout-to-image generation, current methods still struggle with layouts containing significant overlap between bounding boxes. We identify two primary challenges: (1) large overlapping regions and (2) overlapping instances with minimal semantic distinction. Through both qualitative examples and quantitative analysis, we demonstrate how these factors degrade generation quality. To systematically assess this issue, we introduce OverLayScore, a novel metric that quantifies the complexity of overlapping bounding boxes. Our analysis reveals that existing benchmarks are biased toward simpler cases with low OverLayScore values, limiting their effectiveness in evaluating model performance under more challenging conditions. To bridge this gap, we present OverLayBench, a new benchmark featuring high-quality annotations and a balanced distribution across different levels of OverLayScore. As an initial step toward improving performance on complex overlaps, we also propose CreatiLayout-AM, a model fine-tuned on a curated amodal mask dataset. Together, our contributions lay the groundwork for more robust layout-to-image generation under realistic and challenging scenarios. Project link: https://mlpc-ucsd.github.io/OverLayBench.
PDF52September 26, 2025