ChatPaper.aiChatPaper

LogoMotion: Visuell verankerte Code-Generierung für inhaltsbewusste Animationen

LogoMotion: Visually Grounded Code Generation for Content-Aware Animation

May 11, 2024
Autoren: Vivian Liu, Rubaiat Habib Kazi, Li-Yi Wei, Matthew Fisher, Timothy Langlois, Seth Walker, Lydia Chilton
cs.AI

Zusammenfassung

Animierte Logos sind eine überzeugende und allgegenwärtige Möglichkeit, wie Einzelpersonen und Marken sich online präsentieren. Die manuelle Erstellung dieser Logos kann erhebliche künstlerische Fähigkeiten und Mühe erfordern. Um Anfängern beim Animieren von Logos zu helfen, bieten Designwerkzeuge derzeit Vorlagen und Animationsvorgaben an. Diese Lösungen können jedoch in ihrem Ausdrucksspektrum begrenzt sein. Große Sprachmodelle haben das Potenzial, Anfängern zu helfen, animierte Logos zu erstellen, indem sie Animationscode generieren, der auf ihren Inhalten zugeschnitten ist. In diesem Papier stellen wir LogoMotion vor, ein auf LLM basierendes System, das ein geschichtetes Dokument entgegennimmt und animierte Logos durch visuell verankerte Programmsynthese generiert. Wir stellen Techniken vor, um eine HTML-Repräsentation einer Leinwand zu erstellen, primäre und sekundäre Elemente zu identifizieren, Animationscode zu synthetisieren und Animationsfehler visuell zu debuggen. Im Vergleich zu einem branchenüblichen Tool stellen wir fest, dass LogoMotion Animationen produziert, die inhaltssensibler sind und qualitativ gleichwertig sind. Wir schließen mit einer Diskussion über die Auswirkungen von LLM-generierten Animationen auf das Motion Design.
English
Animated logos are a compelling and ubiquitous way individuals and brands represent themselves online. Manually authoring these logos can require significant artistic skill and effort. To help novice designers animate logos, design tools currently offer templates and animation presets. However, these solutions can be limited in their expressive range. Large language models have the potential to help novice designers create animated logos by generating animation code that is tailored to their content. In this paper, we introduce LogoMotion, an LLM-based system that takes in a layered document and generates animated logos through visually-grounded program synthesis. We introduce techniques to create an HTML representation of a canvas, identify primary and secondary elements, synthesize animation code, and visually debug animation errors. When compared with an industry standard tool, we find that LogoMotion produces animations that are more content-aware and are on par in terms of quality. We conclude with a discussion of the implications of LLM-generated animation for motion design.

Summary

AI-Generated Summary

PDF192December 15, 2024