LogoMotion: Visuell verankerte Code-Generierung für inhaltsbewusste Animationen
LogoMotion: Visually Grounded Code Generation for Content-Aware Animation
May 11, 2024
Autoren: Vivian Liu, Rubaiat Habib Kazi, Li-Yi Wei, Matthew Fisher, Timothy Langlois, Seth Walker, Lydia Chilton
cs.AI
Zusammenfassung
Animierte Logos sind eine überzeugende und allgegenwärtige Möglichkeit, wie Einzelpersonen und Marken sich online präsentieren. Die manuelle Erstellung dieser Logos kann erhebliche künstlerische Fähigkeiten und Mühe erfordern. Um Anfängern beim Animieren von Logos zu helfen, bieten Designwerkzeuge derzeit Vorlagen und Animationsvorgaben an. Diese Lösungen können jedoch in ihrem Ausdrucksspektrum begrenzt sein. Große Sprachmodelle haben das Potenzial, Anfängern zu helfen, animierte Logos zu erstellen, indem sie Animationscode generieren, der auf ihren Inhalten zugeschnitten ist. In diesem Papier stellen wir LogoMotion vor, ein auf LLM basierendes System, das ein geschichtetes Dokument entgegennimmt und animierte Logos durch visuell verankerte Programmsynthese generiert. Wir stellen Techniken vor, um eine HTML-Repräsentation einer Leinwand zu erstellen, primäre und sekundäre Elemente zu identifizieren, Animationscode zu synthetisieren und Animationsfehler visuell zu debuggen. Im Vergleich zu einem branchenüblichen Tool stellen wir fest, dass LogoMotion Animationen produziert, die inhaltssensibler sind und qualitativ gleichwertig sind. Wir schließen mit einer Diskussion über die Auswirkungen von LLM-generierten Animationen auf das Motion Design.
English
Animated logos are a compelling and ubiquitous way individuals and brands
represent themselves online. Manually authoring these logos can require
significant artistic skill and effort. To help novice designers animate logos,
design tools currently offer templates and animation presets. However, these
solutions can be limited in their expressive range. Large language models have
the potential to help novice designers create animated logos by generating
animation code that is tailored to their content. In this paper, we introduce
LogoMotion, an LLM-based system that takes in a layered document and generates
animated logos through visually-grounded program synthesis. We introduce
techniques to create an HTML representation of a canvas, identify primary and
secondary elements, synthesize animation code, and visually debug animation
errors. When compared with an industry standard tool, we find that LogoMotion
produces animations that are more content-aware and are on par in terms of
quality. We conclude with a discussion of the implications of LLM-generated
animation for motion design.Summary
AI-Generated Summary