OmniSVG: Een Uniform Model voor het Genereren van Schaalbare VectorafbeeldingenOmniSVG: A Unified Scalable Vector Graphics Generation Model
Scalable Vector Graphics (SVG) is een belangrijk beeldformaat dat veel wordt gebruikt in grafisch ontwerp vanwege de resolutieonafhankelijkheid en bewerkbaarheid. Het onderzoek naar het genereren van hoogwaardige SVG heeft voortdurend aandacht getrokken van zowel ontwerpers als onderzoekers in de AIGC-gemeenschap. Bestaande methoden produceren echter ofwel ongestructureerde uitvoer met enorme rekenkosten, of zijn beperkt tot het genereren van monochrome iconen met overgesimplificeerde structuren. Om hoogwaardige en complexe SVG te produceren, stellen we OmniSVG voor, een uniform raamwerk dat gebruikmaakt van vooraf getrainde Vision-Language Models (VLMs) voor end-to-end multimodale SVG-generatie. Door SVG-commando's en coördinaten te parametriseren in discrete tokens, ontkoppelt OmniSVG structurele logica van laagwaardige geometrie voor efficiënte training, terwijl de expressiviteit van complexe SVG-structuren behouden blijft. Om de ontwikkeling van SVG-synthese verder te bevorderen, introduceren we MMSVG-2M, een multimodale dataset met twee miljoen rijk geannoteerde SVG-elementen, samen met een gestandaardiseerd evaluatieprotocol voor conditionele SVG-generatietaken. Uitgebreide experimenten tonen aan dat OmniSVG bestaande methoden overtreft en het potentieel aantoont voor integratie in professionele SVG-ontwerpwerkstromen.