LogoMotion: Geração de Código Visualmente Fundamentada para Animação com Consciência de Conteúdo
LogoMotion: Visually Grounded Code Generation for Content-Aware Animation
May 11, 2024
Autores: Vivian Liu, Rubaiat Habib Kazi, Li-Yi Wei, Matthew Fisher, Timothy Langlois, Seth Walker, Lydia Chilton
cs.AI
Resumo
Logos animados são uma maneira envolvente e onipresente de indivíduos e marcas se representarem online. Criar esses logos manualmente pode exigir habilidades artísticas significativas e muito esforço. Para ajudar designers iniciantes a animar logos, as ferramentas de design atualmente oferecem modelos e predefinições de animação. No entanto, essas soluções podem ser limitadas em sua gama expressiva. Modelos de linguagem de grande escala têm o potencial de ajudar designers iniciantes a criar logos animados, gerando código de animação personalizado para seu conteúdo. Neste artigo, apresentamos o LogoMotion, um sistema baseado em LLM que recebe um documento em camadas e gera logos animados por meio de síntese de programas visualmente fundamentada. Introduzimos técnicas para criar uma representação HTML de uma tela, identificar elementos primários e secundários, sintetizar código de animação e depurar visualmente erros de animação. Quando comparado com uma ferramenta padrão da indústria, descobrimos que o LogoMotion produz animações mais conscientes do conteúdo e com qualidade equivalente. Concluímos com uma discussão sobre as implicações da animação gerada por LLM para o design de movimento.
English
Animated logos are a compelling and ubiquitous way individuals and brands
represent themselves online. Manually authoring these logos can require
significant artistic skill and effort. To help novice designers animate logos,
design tools currently offer templates and animation presets. However, these
solutions can be limited in their expressive range. Large language models have
the potential to help novice designers create animated logos by generating
animation code that is tailored to their content. In this paper, we introduce
LogoMotion, an LLM-based system that takes in a layered document and generates
animated logos through visually-grounded program synthesis. We introduce
techniques to create an HTML representation of a canvas, identify primary and
secondary elements, synthesize animation code, and visually debug animation
errors. When compared with an industry standard tool, we find that LogoMotion
produces animations that are more content-aware and are on par in terms of
quality. We conclude with a discussion of the implications of LLM-generated
animation for motion design.