Tipografía Dinámica: Dando Vida a las Palabras
Dynamic Typography: Bringing Words to Life
April 17, 2024
Autores: Zichen Liu, Yihao Meng, Hao Ouyang, Yue Yu, Bolin Zhao, Daniel Cohen-Or, Huamin Qu
cs.AI
Resumen
La animación de texto sirve como un medio expresivo, transformando la comunicación estática en experiencias dinámicas al infundir movimiento a las palabras para evocar emociones, enfatizar significados y construir narrativas convincentes. Crear animaciones que sean semánticamente conscientes plantea desafíos significativos, requiriendo experiencia en diseño gráfico y animación. Presentamos un esquema automatizado de animación de texto, denominado "Tipografía Dinámica", que combina dos tareas desafiantes. Deforma las letras para transmitir significado semántico y las infunde con movimientos vibrantes basados en indicaciones del usuario. Nuestra técnica aprovecha representaciones de gráficos vectoriales y un marco de optimización de extremo a extremo. Este marco emplea campos de desplazamiento neuronal para convertir letras en formas base y aplica movimiento por fotograma, fomentando la coherencia con el concepto textual deseado. Se emplean técnicas de preservación de forma y regularización de pérdida perceptual para mantener la legibilidad y la integridad estructural durante el proceso de animación. Demostramos la generalizabilidad de nuestro enfoque en varios modelos de texto a video y destacamos la superioridad de nuestra metodología de extremo a extremo sobre métodos base, que podrían consistir en tareas separadas. A través de evaluaciones cuantitativas y cualitativas, demostramos la efectividad de nuestro marco en la generación de animaciones de texto coherentes que interpretan fielmente las indicaciones del usuario mientras mantienen la legibilidad. Nuestro código está disponible en: https://animate-your-word.github.io/demo/.
English
Text animation serves as an expressive medium, transforming static
communication into dynamic experiences by infusing words with motion to evoke
emotions, emphasize meanings, and construct compelling narratives. Crafting
animations that are semantically aware poses significant challenges, demanding
expertise in graphic design and animation. We present an automated text
animation scheme, termed "Dynamic Typography", which combines two challenging
tasks. It deforms letters to convey semantic meaning and infuses them with
vibrant movements based on user prompts. Our technique harnesses vector
graphics representations and an end-to-end optimization-based framework. This
framework employs neural displacement fields to convert letters into base
shapes and applies per-frame motion, encouraging coherence with the intended
textual concept. Shape preservation techniques and perceptual loss
regularization are employed to maintain legibility and structural integrity
throughout the animation process. We demonstrate the generalizability of our
approach across various text-to-video models and highlight the superiority of
our end-to-end methodology over baseline methods, which might comprise separate
tasks. Through quantitative and qualitative evaluations, we demonstrate the
effectiveness of our framework in generating coherent text animations that
faithfully interpret user prompts while maintaining readability. Our code is
available at: https://animate-your-word.github.io/demo/.