LogoMotion: Визуально обоснованная генерация кода для анимации, осведомленной о контенте
LogoMotion: Visually Grounded Code Generation for Content-Aware Animation
May 11, 2024
Авторы: Vivian Liu, Rubaiat Habib Kazi, Li-Yi Wei, Matthew Fisher, Timothy Langlois, Seth Walker, Lydia Chilton
cs.AI
Аннотация
Анимированные логотипы - это убедительный и всеобщий способ, которым индивиды и бренды представляют себя в онлайне. Ручное создание этих логотипов может потребовать значительного художественного мастерства и усилий. Для помощи начинающим дизайнерам в анимации логотипов существующие инструменты предлагают шаблоны и предустановленные анимации. Однако эти решения могут быть ограничены в своем выразительном диапазоне. Большие языковые модели имеют потенциал помочь начинающим дизайнерам создавать анимированные логотипы, генерируя код анимации, настроенный под их контент. В данной статье мы представляем LogoMotion, систему на основе LLM, которая принимает на вход слоистый документ и генерирует анимированные логотипы через визуально обоснованный синтез программ. Мы представляем техники создания HTML-представления холста, определения основных и вторичных элементов, синтеза кода анимации и визуальной отладки ошибок анимации. При сравнении с индустриальным стандартным инструментом мы обнаружили, что LogoMotion создает анимации, которые более осведомлены о контенте и качественно не уступают. Мы заключаем статью обсуждением последствий анимации, созданной с помощью LLM, для дизайна движения.
English
Animated logos are a compelling and ubiquitous way individuals and brands
represent themselves online. Manually authoring these logos can require
significant artistic skill and effort. To help novice designers animate logos,
design tools currently offer templates and animation presets. However, these
solutions can be limited in their expressive range. Large language models have
the potential to help novice designers create animated logos by generating
animation code that is tailored to their content. In this paper, we introduce
LogoMotion, an LLM-based system that takes in a layered document and generates
animated logos through visually-grounded program synthesis. We introduce
techniques to create an HTML representation of a canvas, identify primary and
secondary elements, synthesize animation code, and visually debug animation
errors. When compared with an industry standard tool, we find that LogoMotion
produces animations that are more content-aware and are on par in terms of
quality. We conclude with a discussion of the implications of LLM-generated
animation for motion design.Summary
AI-Generated Summary