T2I-ReasonBench: 推論を考慮したテキストから画像生成のベンチマーク
T2I-ReasonBench: Benchmarking Reasoning-Informed Text-to-Image Generation
August 24, 2025
著者: Kaiyue Sun, Rongyao Fang, Chengqi Duan, Xian Liu, Xihui Liu
cs.AI
要旨
我々は、テキストから画像(T2I)モデルの推論能力を評価するベンチマーク「T2I-ReasonBench」を提案する。これは、慣用句解釈、テキスト画像デザイン、エンティティ推論、科学的推論の4つの次元で構成されている。推論の正確性と画像品質を評価するために、2段階の評価プロトコルを提案する。様々なT2I生成モデルをベンチマークし、その性能に関する包括的な分析を提供する。
English
We propose T2I-ReasonBench, a benchmark evaluating reasoning capabilities of
text-to-image (T2I) models. It consists of four dimensions: Idiom
Interpretation, Textual Image Design, Entity-Reasoning and
Scientific-Reasoning. We propose a two-stage evaluation protocol to assess the
reasoning accuracy and image quality. We benchmark various T2I generation
models, and provide comprehensive analysis on their performances.