LeX-Art: スケーラブルで高品質なデータ合成によるテキスト生成の再考
LeX-Art: Rethinking Text Generation via Scalable High-Quality Data Synthesis
March 27, 2025
著者: Shitian Zhao, Qilong Wu, Xinyue Li, Bo Zhang, Ming Li, Qi Qin, Dongyang Liu, Kaipeng Zhang, Hongsheng Li, Yu Qiao, Peng Gao, Bin Fu, Zhen Li
cs.AI
要旨
我々はLeX-Artを紹介する。これは、プロンプトの表現力とテキストレンダリングの忠実度の間のギャップを体系的に埋める、高品質なテキスト画像合成のための包括的なスイートである。我々のアプローチはデータ中心のパラダイムに従い、Deepseek-R1に基づいた高品質なデータ合成パイプラインを構築し、10,000枚の高解像度(1024×1024)で美的に洗練された画像からなるLeX-10Kデータセットをキュレーションした。データセット構築に加えて、我々は堅牢なプロンプト拡張モデルであるLeX-Enhancerを開発し、2つのテキスト画像モデル、LeX-FLUXとLeX-Luminaをトレーニングし、最先端のテキストレンダリング性能を達成した。視覚的テキスト生成を体系的に評価するために、我々はLeX-Benchを導入し、忠実度、美的感覚、整合性を評価する。これに加えて、堅牢なテキスト精度評価のための新しい指標であるPairwise Normalized Edit Distance(PNED)を補完的に使用する。実験結果は、LeX-LuminaがCreateBenchで79.81%のPNED向上を達成し、LeX-FLUXが色精度(+3.18%)、位置精度(+4.45%)、フォント精度(+3.81%)においてベースラインを上回るなど、大幅な改善を示している。我々のコード、モデル、データセット、デモは公開されている。
English
We introduce LeX-Art, a comprehensive suite for high-quality text-image
synthesis that systematically bridges the gap between prompt expressiveness and
text rendering fidelity. Our approach follows a data-centric paradigm,
constructing a high-quality data synthesis pipeline based on Deepseek-R1 to
curate LeX-10K, a dataset of 10K high-resolution, aesthetically refined
1024times1024 images. Beyond dataset construction, we develop LeX-Enhancer,
a robust prompt enrichment model, and train two text-to-image models, LeX-FLUX
and LeX-Lumina, achieving state-of-the-art text rendering performance. To
systematically evaluate visual text generation, we introduce LeX-Bench, a
benchmark that assesses fidelity, aesthetics, and alignment, complemented by
Pairwise Normalized Edit Distance (PNED), a novel metric for robust text
accuracy evaluation. Experiments demonstrate significant improvements, with
LeX-Lumina achieving a 79.81% PNED gain on CreateBench, and LeX-FLUX
outperforming baselines in color (+3.18%), positional (+4.45%), and font
accuracy (+3.81%). Our codes, models, datasets, and demo are publicly
available.Summary
AI-Generated Summary