ChatPaper.aiChatPaper

T2I-CompBench: 오픈 월드 조합적 텍스트-이미지 생성을 위한 포괄적 벤치마크

T2I-CompBench: A Comprehensive Benchmark for Open-world Compositional Text-to-image Generation

July 12, 2023
저자: Kaiyi Huang, Kaiyue Sun, Enze Xie, Zhenguo Li, Xihui Liu
cs.AI

초록

최근 텍스트-이미지 모델들이 고품질 이미지를 생성하는 놀라운 능력을 보여주고 있음에도 불구하고, 현재의 접근 방식들은 다양한 속성과 관계를 가진 객체들을 복잡하고 일관된 장면으로 효과적으로 구성하는 데 어려움을 겪고 있습니다. 우리는 개방형 세계의 조합적 텍스트-이미지 생성을 위한 포괄적인 벤치마크인 T2I-CompBench를 제안합니다. 이 벤치마크는 3개의 범주(속성 바인딩, 객체 관계, 복잡한 조합)와 6개의 하위 범주(색상 바인딩, 형태 바인딩, 질감 바인딩, 공간적 관계, 비공간적 관계, 복잡한 조합)로 구성된 6,000개의 조합적 텍스트 프롬프트를 포함합니다. 또한, 우리는 조합적 텍스트-이미지 생성을 평가하기 위해 특별히 설계된 여러 평가 지표를 제안합니다. 사전 학습된 텍스트-이미지 모델의 조합적 텍스트-이미지 생성 능력을 향상시키기 위해, 보상 기반 샘플 선택을 통한 생성 모델 미세 조정(GORS)이라는 새로운 접근 방식을 소개합니다. T2I-CompBench에서 기존 방법들을 벤치마킹하고, 우리가 제안한 평가 지표와 GORS 접근 방식의 효과를 검증하기 위해 광범위한 실험과 평가를 수행했습니다. 프로젝트 페이지는 https://karine-h.github.io/T2I-CompBench/에서 확인할 수 있습니다.
English
Despite the stunning ability to generate high-quality images by recent text-to-image models, current approaches often struggle to effectively compose objects with different attributes and relationships into a complex and coherent scene. We propose T2I-CompBench, a comprehensive benchmark for open-world compositional text-to-image generation, consisting of 6,000 compositional text prompts from 3 categories (attribute binding, object relationships, and complex compositions) and 6 sub-categories (color binding, shape binding, texture binding, spatial relationships, non-spatial relationships, and complex compositions). We further propose several evaluation metrics specifically designed to evaluate compositional text-to-image generation. We introduce a new approach, Generative mOdel fine-tuning with Reward-driven Sample selection (GORS), to boost the compositional text-to-image generation abilities of pretrained text-to-image models. Extensive experiments and evaluations are conducted to benchmark previous methods on T2I-CompBench, and to validate the effectiveness of our proposed evaluation metrics and GORS approach. Project page is available at https://karine-h.github.io/T2I-CompBench/.
PDF70December 15, 2024