OverLayBench: 密集オーバーラップを伴うレイアウトから画像生成のためのベンチマーク
OverLayBench: A Benchmark for Layout-to-Image Generation with Dense Overlaps
September 23, 2025
著者: Bingnan Li, Chen-Yu Wang, Haiyang Xu, Xiang Zhang, Ethan Armand, Divyansh Srivastava, Xiaojun Shan, Zeyuan Chen, Jianwen Xie, Zhuowen Tu
cs.AI
要旨
レイアウトから画像生成の分野では着実な進展が見られるものの、現行の手法はバウンディングボックス間の重なりが大きいレイアウトに対して依然として苦戦しています。私たちは、この問題における2つの主要な課題を特定しました:(1) 大きな重なり領域と、(2) 意味的な区別が最小限の重なりインスタンスです。定性的な事例と定量的な分析を通じて、これらの要因が生成品質をどのように低下させるかを実証します。この問題を体系的に評価するため、重なりバウンディングボックスの複雑さを定量化する新しい指標であるOverLayScoreを導入しました。私たちの分析により、既存のベンチマークがOverLayScore値の低い単純なケースに偏っており、より挑戦的な条件下でのモデル性能の評価においてその有効性が制限されていることが明らかになりました。このギャップを埋めるため、高品質なアノテーションとOverLayScoreの異なるレベルにわたるバランスの取れた分布を特徴とする新しいベンチマーク、OverLayBenchを提案します。さらに、複雑な重なりに対する性能向上に向けた最初のステップとして、キュレーションされたアモーダルマスクデータセットでファインチューニングされたモデル、CreatiLayout-AMを提案します。これらの貢献を通じて、現実的で挑戦的なシナリオ下でのより堅牢なレイアウトから画像生成の基盤を築きます。プロジェクトリンク: https://mlpc-ucsd.github.io/OverLayBench。
English
Despite steady progress in layout-to-image generation, current methods still
struggle with layouts containing significant overlap between bounding boxes. We
identify two primary challenges: (1) large overlapping regions and (2)
overlapping instances with minimal semantic distinction. Through both
qualitative examples and quantitative analysis, we demonstrate how these
factors degrade generation quality. To systematically assess this issue, we
introduce OverLayScore, a novel metric that quantifies the complexity of
overlapping bounding boxes. Our analysis reveals that existing benchmarks are
biased toward simpler cases with low OverLayScore values, limiting their
effectiveness in evaluating model performance under more challenging
conditions. To bridge this gap, we present OverLayBench, a new benchmark
featuring high-quality annotations and a balanced distribution across different
levels of OverLayScore. As an initial step toward improving performance on
complex overlaps, we also propose CreatiLayout-AM, a model fine-tuned on a
curated amodal mask dataset. Together, our contributions lay the groundwork for
more robust layout-to-image generation under realistic and challenging
scenarios. Project link: https://mlpc-ucsd.github.io/OverLayBench.