LogoMotion: Generazione di Codice Basata su Contesto Visivo per Animazioni Consapevoli del Contenuto
LogoMotion: Visually Grounded Code Generation for Content-Aware Animation
May 11, 2024
Autori: Vivian Liu, Rubaiat Habib Kazi, Li-Yi Wei, Matthew Fisher, Timothy Langlois, Seth Walker, Lydia Chilton
cs.AI
Abstract
I loghi animati rappresentano un modo accattivante e ubiquitario con cui individui e brand si presentano online. La creazione manuale di questi loghi può richiedere notevoli competenze artistiche e sforzi. Per aiutare i designer principianti ad animare i loghi, gli strumenti di design attualmente offrono modelli e preset di animazione. Tuttavia, queste soluzioni possono essere limitate nella loro gamma espressiva. I modelli linguistici di grandi dimensioni hanno il potenziale di aiutare i designer principianti a creare loghi animati generando codice di animazione personalizzato in base al loro contenuto. In questo articolo, presentiamo LogoMotion, un sistema basato su LLM che prende in input un documento stratificato e genera loghi animati attraverso la sintesi di programmi visivamente fondati. Introduciamo tecniche per creare una rappresentazione HTML di una canvas, identificare elementi primari e secondari, sintetizzare codice di animazione e correggere visivamente gli errori di animazione. Confrontato con uno strumento standard del settore, LogoMotion produce animazioni più consapevoli del contenuto e di qualità paragonabile. Concludiamo con una discussione sulle implicazioni delle animazioni generate da LLM per il design del movimento.
English
Animated logos are a compelling and ubiquitous way individuals and brands
represent themselves online. Manually authoring these logos can require
significant artistic skill and effort. To help novice designers animate logos,
design tools currently offer templates and animation presets. However, these
solutions can be limited in their expressive range. Large language models have
the potential to help novice designers create animated logos by generating
animation code that is tailored to their content. In this paper, we introduce
LogoMotion, an LLM-based system that takes in a layered document and generates
animated logos through visually-grounded program synthesis. We introduce
techniques to create an HTML representation of a canvas, identify primary and
secondary elements, synthesize animation code, and visually debug animation
errors. When compared with an industry standard tool, we find that LogoMotion
produces animations that are more content-aware and are on par in terms of
quality. We conclude with a discussion of the implications of LLM-generated
animation for motion design.