ChatPaper.aiChatPaper

DreamPoster: Um Framework Unificado para Design de Pôsteres Gerativos Condicionados por Imagem

DreamPoster: A Unified Framework for Image-Conditioned Generative Poster Design

July 6, 2025
Autores: Xiwei Hu, Haokun Chen, Zhongqi Qi, Hui Zhang, Dexiang Hong, Jie Shao, Xinglong Wu
cs.AI

Resumo

Apresentamos o DreamPoster, uma estrutura de geração de Texto para Imagem que sintetiza inteligentemente pôsteres de alta qualidade a partir de imagens e prompts de texto fornecidos pelo usuário, mantendo a fidelidade do conteúdo e suportando saídas de resolução e layout flexíveis. Especificamente, o DreamPoster é construído sobre nosso modelo T2I, o Seedream3.0, para processar uniformemente diferentes tipos de geração de pôsteres. Para a construção do conjunto de dados, propomos um pipeline sistemático de anotação de dados que anota precisamente o conteúdo textual e as informações de hierarquia tipográfica dentro das imagens dos pôsteres, enquanto emprega metodologias abrangentes para construir conjuntos de dados pareados que incluem materiais de origem (por exemplo, gráficos/textos brutos) e suas saídas de pôsteres finais correspondentes. Além disso, implementamos uma estratégia de treinamento progressivo que permite ao modelo adquirir hierarquicamente capacidades de geração multitarefa, mantendo uma geração de alta qualidade. As avaliações em nossos benchmarks de teste demonstram a superioridade do DreamPoster sobre os métodos existentes, alcançando uma alta taxa de usabilidade de 88,55\%, em comparação com o GPT-4o (47,56\%) e o SeedEdit3.0 (25,96\%). O DreamPoster estará disponível online no Jimeng e em outros aplicativos da Bytedance.
English
We present DreamPoster, a Text-to-Image generation framework that intelligently synthesizes high-quality posters from user-provided images and text prompts while maintaining content fidelity and supporting flexible resolution and layout outputs. Specifically, DreamPoster is built upon our T2I model, Seedream3.0 to uniformly process different poster generating types. For dataset construction, we propose a systematic data annotation pipeline that precisely annotates textual content and typographic hierarchy information within poster images, while employing comprehensive methodologies to construct paired datasets comprising source materials (e.g., raw graphics/text) and their corresponding final poster outputs. Additionally, we implement a progressive training strategy that enables the model to hierarchically acquire multi-task generation capabilities while maintaining high-quality generation. Evaluations on our testing benchmarks demonstrate DreamPoster's superiority over existing methods, achieving a high usability rate of 88.55\%, compared to GPT-4o (47.56\%) and SeedEdit3.0 (25.96\%). DreamPoster will be online in Jimeng and other Bytedance Apps.
PDF121July 15, 2025