OmniSVG : Un modèle unifié de génération de graphiques vectoriels évolutifsOmniSVG: A Unified Scalable Vector Graphics Generation Model
Les graphiques vectoriels évolutifs (SVG) constituent un format d'image important largement adopté dans le domaine de la conception graphique en raison de leur indépendance à la résolution et de leur capacité d'édition. L'étude de la génération de SVG de haute qualité a continuellement attiré l'attention des concepteurs et des chercheurs de la communauté AIGC. Cependant, les méthodes existantes produisent soit des résultats non structurés avec un coût de calcul élevé, soit se limitent à générer des icônes monochromes aux structures trop simplifiées. Pour produire des SVG complexes et de haute qualité, nous proposons OmniSVG, un cadre unifié qui exploite des modèles vision-langage pré-entraînés (VLMs) pour la génération multimodale de SVG de bout en bout. En paramétrant les commandes et les coordonnées SVG en tokens discrets, OmniSVG découple la logique structurelle de la géométrie de bas niveau pour un entraînement efficace tout en conservant l'expressivité des structures SVG complexes. Pour faire progresser le développement de la synthèse SVG, nous introduisons MMSVG-2M, un ensemble de données multimodales contenant deux millions d'actifs SVG richement annotés, ainsi qu'un protocole d'évaluation standardisé pour les tâches de génération conditionnelle de SVG. Des expériences approfondies montrent qu'OmniSVG surpasse les méthodes existantes et démontre son potentiel d'intégration dans les flux de travail professionnels de conception SVG.