Одно предложение, одна драма: генерация персонализированных короткоформатных драм с помощью мультиагентных систем
One Sentence, One Drama: Personalized Short-Form Drama Generation via Multi-Agent Systems
May 21, 2026
Авторы: Yufei Shi, Weilong Yan, Naixuan Huang, Yucheng Chen, Chenyu Zhang, Tao He, Si Yong Yeo, Ming Li
cs.AI
Аннотация
Существующие подходы к созданию цифровых короткометражек обычно полагаются на сценарии, сгенерированные одношаговыми LLM, и слабо связанные пайплайны, что не удовлетворяет трем ключевым требованиям к генерации короткометражек: (1) темп повествования, что приводит к слабым зацепкам, недостаточной эскалации и непривлекательным концовкам; (2) пространственная согласованность, что ведет к смещению планировок сцен и несогласованным позициям персонажей между клипами; (3) контроль качества на уровне производства, требующий обширной ручной проверки и коррекции на этапах сценария и визуализации. Мы представляем One Sentence, One Drama — иерархическую многоагентную структуру, которая преобразует однофразовую идею пользователя в полностью готовую короткометражку через структурированные промежуточные модули и итеративное уточнение. Наш подход основан на трех ключевых компонентах: (1) модуль генерации сюжета на основе дебатов многоагентной системы, который обеспечивает темп короткометражки и связность повествования; (2) 3D-обоснованный механизм генерации первого кадра, устанавливающий общую пространственную привязку для согласованного позиционирования персонажей и планировки сцен между клипами; (3) многоэтапные циклы рецензирования, выполняющие всестороннее выявление ошибок и целенаправленную коррекцию на этапах сценария, визуализации и генерации видео. Мы также вводим сценарный подбор фоновой музыки (BGM) и планирование переходов между сценами для улучшения иммерсивного опыта зрителей. Для систематической оценки этой задачи мы представляем Short-Drama-Bench — бенчмарк, расширяющий стандартные метрики качества видео критериями, специфичными для короткометражек. Экспериментальные результаты показывают, что наш метод значительно превосходит существующие пайплайны по качеству повествования, согласованности между клипами и общему впечатлению от просмотра.
English
Existing approaches for digital short-drama production typically rely on one-shot LLM generated scripts and loosely coupled pipelines, which fail to satisfy three key requirements of short-drama generation: (1) narrative pacing, resulting in weak hooks, insufficient escalation, and unattractive endings; (2) spatial consistency, leading to drifting scene layouts and inconsistent character positions across clips; and (3) production-level quality control, requiring extensive manual review and correction across script and visual stages. We present One Sentence, One Drama, a hierarchical multi-agent framework that transforms a user's single-sentence idea into a fully produced short drama through structured intermediate modules and iterative refinement. Our approach is built upon three key components: (1) a multi-agent debate-based story generation module that enforces short-drama pacing and narrative coherence; (2) a 3D-grounded first-frame generation mechanism that establishes a shared spatial reference for consistent character positioning and scene layout across clips; and (3) multi-stage reviewer loops that perform comprehensive error detection and targeted revision across script, visual, and video generation stages. We also introduce scene-level BGM matching and scene transition planning to improve the audience's immersive experience. To systematically evaluate this task, we introduce Short-Drama-Bench, a benchmark that extends standard video quality metrics with short-drama-specific criteria. Experimental results demonstrate that our method significantly outperforms existing pipelines in narrative quality, cross-clip consistency, and overall viewing experience.