LogoMotion: Visueel Onderbouwde Codegeneratie voor Inhoudsbewuste Animatie
LogoMotion: Visually Grounded Code Generation for Content-Aware Animation
May 11, 2024
Auteurs: Vivian Liu, Rubaiat Habib Kazi, Li-Yi Wei, Matthew Fisher, Timothy Langlois, Seth Walker, Lydia Chilton
cs.AI
Samenvatting
Geanimeerde logo's zijn een boeiende en alomtegenwoordige manier waarop individuen en merken zichzelf online vertegenwoordigen. Het handmatig ontwerpen van deze logo's kan aanzienlijke artistieke vaardigheid en inspanning vereisen. Om beginnende ontwerpers te helpen bij het animeren van logo's, bieden ontwerptools momenteel sjablonen en animatievoorinstellingen. Deze oplossingen kunnen echter beperkt zijn in hun expressieve bereik. Grote taalmodellen hebben het potentieel om beginnende ontwerpers te helpen bij het creëren van geanimeerde logo's door animatiecode te genereren die is afgestemd op hun inhoud. In dit artikel introduceren we LogoMotion, een op grote taalmodellen gebaseerd systeem dat een gelaagd document als invoer neemt en geanimeerde logo's genereert via visueel onderbouwde programma-synthese. We introduceren technieken om een HTML-representatie van een canvas te creëren, primaire en secundaire elementen te identificeren, animatiecode te synthetiseren en visueel animatiefouten te debuggen. In vergelijking met een industriestandaard tool, constateren we dat LogoMotion animaties produceert die meer inhoudsbewust zijn en qua kwaliteit op hetzelfde niveau liggen. We sluiten af met een bespreking van de implicaties van door grote taalmodellen gegenereerde animatie voor motion design.
English
Animated logos are a compelling and ubiquitous way individuals and brands
represent themselves online. Manually authoring these logos can require
significant artistic skill and effort. To help novice designers animate logos,
design tools currently offer templates and animation presets. However, these
solutions can be limited in their expressive range. Large language models have
the potential to help novice designers create animated logos by generating
animation code that is tailored to their content. In this paper, we introduce
LogoMotion, an LLM-based system that takes in a layered document and generates
animated logos through visually-grounded program synthesis. We introduce
techniques to create an HTML representation of a canvas, identify primary and
secondary elements, synthesize animation code, and visually debug animation
errors. When compared with an industry standard tool, we find that LogoMotion
produces animations that are more content-aware and are on par in terms of
quality. We conclude with a discussion of the implications of LLM-generated
animation for motion design.