OmniSVG: Um Modelo Unificado de Geração de Gráficos Vetoriais EscaláveisOmniSVG: A Unified Scalable Vector Graphics Generation Model
Scalable Vector Graphics (SVG) é um formato de imagem importante amplamente adotado em design gráfico devido à sua independência de resolução e editabilidade. O estudo da geração de SVG de alta qualidade tem continuamente atraído a atenção de designers e pesquisadores na comunidade de AIGC. No entanto, os métodos existentes ou produzem saídas não estruturadas com um custo computacional elevado ou são limitados à geração de ícones monocromáticos com estruturas excessivamente simplificadas. Para produzir SVG de alta qualidade e complexos, propomos o OmniSVG, um framework unificado que aproveita modelos de visão e linguagem pré-treinados (VLMs) para a geração multimodal de SVG de ponta a ponta. Ao parametrizar comandos e coordenadas SVG em tokens discretos, o OmniSVG desacopla a lógica estrutural da geometria de baixo nível para um treinamento eficiente, mantendo a expressividade de estruturas SVG complexas. Para avançar ainda mais o desenvolvimento da síntese de SVG, introduzimos o MMSVG-2M, um conjunto de dados multimodal com dois milhões de ativos SVG ricamente anotados, juntamente com um protocolo de avaliação padronizado para tarefas de geração condicional de SVG. Experimentos extensivos mostram que o OmniSVG supera os métodos existentes e demonstra seu potencial para integração em fluxos de trabalho profissionais de design SVG.