Una Frase, Un Drama: Generación Personalizada de Dramas Breves mediante Sistemas Multiagente
One Sentence, One Drama: Personalized Short-Form Drama Generation via Multi-Agent Systems
May 21, 2026
Autores: Yufei Shi, Weilong Yan, Naixuan Huang, Yucheng Chen, Chenyu Zhang, Tao He, Si Yong Yeo, Ming Li
cs.AI
Resumen
Los enfoques existentes para la producción de microdramas digitales suelen basarse en guiones generados por LLM en una sola ejecución y en pipelines débilmente acoplados, lo que no logra satisfacer tres requisitos clave de la generación de microdramas: (1) ritmo narrativo, lo que da lugar a ganchos débiles, escalada insuficiente y finales poco atractivos; (2) consistencia espacial, que provoca diseños de escena cambiantes y posiciones de personajes inconsistentes entre clips; y (3) control de calidad a nivel de producción, que requiere una extensa revisión y corrección manual tanto en la etapa de guion como en la visual. Presentamos *One Sentence, One Drama*, un marco multiagente jerárquico que transforma la idea de una sola frase del usuario en un microdrama completamente producido a través de módulos intermedios estructurados y refinamiento iterativo. Nuestro enfoque se sustenta en tres componentes clave: (1) un módulo de generación de historias basado en debate multiagente que impone el ritmo narrativo y la coherencia del microdrama; (2) un mecanismo de generación del primer fotograma basado en 3D que establece una referencia espacial compartida para un posicionamiento consistente de personajes y diseño de escena entre clips; y (3) bucles de revisión multietapa que realizan una detección exhaustiva de errores y una revisión dirigida en las etapas de guion, visual y de generación de video. También introducimos la combinación de música de fondo (BGM) a nivel de escena y la planificación de transiciones de escena para mejorar la experiencia inmersiva del público. Para evaluar sistemáticamente esta tarea, presentamos *Short-Drama-Bench*, un punto de referencia que amplía las métricas estándar de calidad de video con criterios específicos para microdramas. Los resultados experimentales demuestran que nuestro método supera significativamente a los pipelines existentes en calidad narrativa, consistencia entre clips y experiencia visual general.
English
Existing approaches for digital short-drama production typically rely on one-shot LLM generated scripts and loosely coupled pipelines, which fail to satisfy three key requirements of short-drama generation: (1) narrative pacing, resulting in weak hooks, insufficient escalation, and unattractive endings; (2) spatial consistency, leading to drifting scene layouts and inconsistent character positions across clips; and (3) production-level quality control, requiring extensive manual review and correction across script and visual stages. We present One Sentence, One Drama, a hierarchical multi-agent framework that transforms a user's single-sentence idea into a fully produced short drama through structured intermediate modules and iterative refinement. Our approach is built upon three key components: (1) a multi-agent debate-based story generation module that enforces short-drama pacing and narrative coherence; (2) a 3D-grounded first-frame generation mechanism that establishes a shared spatial reference for consistent character positioning and scene layout across clips; and (3) multi-stage reviewer loops that perform comprehensive error detection and targeted revision across script, visual, and video generation stages. We also introduce scene-level BGM matching and scene transition planning to improve the audience's immersive experience. To systematically evaluate this task, we introduce Short-Drama-Bench, a benchmark that extends standard video quality metrics with short-drama-specific criteria. Experimental results demonstrate that our method significantly outperforms existing pipelines in narrative quality, cross-clip consistency, and overall viewing experience.