LogoMotion: Visueel Onderbouwde Codegeneratie voor Inhoudsbewuste Animatie

Samenvatting

Geanimeerde logo's zijn een boeiende en alomtegenwoordige manier waarop individuen en merken zichzelf online vertegenwoordigen. Het handmatig ontwerpen van deze logo's kan aanzienlijke artistieke vaardigheid en inspanning vereisen. Om beginnende ontwerpers te helpen bij het animeren van logo's, bieden ontwerptools momenteel sjablonen en animatievoorinstellingen. Deze oplossingen kunnen echter beperkt zijn in hun expressieve bereik. Grote taalmodellen hebben het potentieel om beginnende ontwerpers te helpen bij het creëren van geanimeerde logo's door animatiecode te genereren die is afgestemd op hun inhoud. In dit artikel introduceren we LogoMotion, een op grote taalmodellen gebaseerd systeem dat een gelaagd document als invoer neemt en geanimeerde logo's genereert via visueel onderbouwde programma-synthese. We introduceren technieken om een HTML-representatie van een canvas te creëren, primaire en secundaire elementen te identificeren, animatiecode te synthetiseren en visueel animatiefouten te debuggen. In vergelijking met een industriestandaard tool, constateren we dat LogoMotion animaties produceert die meer inhoudsbewust zijn en qua kwaliteit op hetzelfde niveau liggen. We sluiten af met een bespreking van de implicaties van door grote taalmodellen gegenereerde animatie voor motion design.

English

Animated logos are a compelling and ubiquitous way individuals and brands represent themselves online. Manually authoring these logos can require significant artistic skill and effort. To help novice designers animate logos, design tools currently offer templates and animation presets. However, these solutions can be limited in their expressive range. Large language models have the potential to help novice designers create animated logos by generating animation code that is tailored to their content. In this paper, we introduce LogoMotion, an LLM-based system that takes in a layered document and generates animated logos through visually-grounded program synthesis. We introduce techniques to create an HTML representation of a canvas, identify primary and secondary elements, synthesize animation code, and visually debug animation errors. When compared with an industry standard tool, we find that LogoMotion produces animations that are more content-aware and are on par in terms of quality. We conclude with a discussion of the implications of LLM-generated animation for motion design.

LogoMotion: Visueel Onderbouwde Codegeneratie voor Inhoudsbewuste Animatie

LogoMotion: Visually Grounded Code Generation for Content-Aware Animation

Samenvatting

Support