Story2Proposal: Каркас для структурированного написания научных статей
Story2Proposal: A Scaffold for Structured Scientific Paper Writing
March 28, 2026
Авторы: Zhuoyang Qian, Wei Shi, Xu Lin, Li Ling, Meng Luo, Ziming Wang, Zhiwei Zhang, Tengyue Xu, Gaoge Liu, Zhentao Zhang, Shuo Zhang, Ziqi Wang, Zheng Feng, Yan Luo, Shu Xu, Yongjin Chen, Zhibo Feng, Zhuo Chen, Bruce Yuan, Biao Wu, Harry Wang, Kris Chen
cs.AI
Аннотация
Создание научных рукописей требует поддержания согласованности между нарративной логикой, экспериментальными данными и визуальными элементами на протяжении всего жизненного цикла документа. Существующие конвейеры генерации на основе языковых моделей полагаются на неограниченный синтез текста с валидацией, применяемой только после генерации, что часто приводит к структурным сдвигам, отсутствию рисунков или таблиц и несогласованности между разделами. Мы представляем Story2Proposal — управляемую контрактом мультиагентную систему, которая преобразует исследовательский нарратив в структурированную рукопись с помощью скоординированных агентов, работающих под действием постоянного общего визуального контракта. Система организует агентов-архитекторов, писателей, редакторов и визуализаторов вокруг состояния контракта, которое отслеживает структуру разделов и зарегистрированные визуальные элементы, в то время как агенты оценки предоставляют обратную связь в цикле «генерируй-оценивай-адаптируй», обновляя контракт в процессе генерации. Эксперименты на задачах, производных от исследовательского корпуса Jericho, показывают, что Story2Proposal достигла экспертной оценки 6.145 против 3.963 у DirectChat (+2.182) на базе моделей GPT, Claude, Gemini и Qwen. По сравнению с базовым методом структурированной генерации Fars, Story2Proposal получила средний балл 5.705 против 5.197, что указывает на улучшенную структурную согласованность и визуальную согласованность.
English
Generating scientific manuscripts requires maintaining alignment between narrative reasoning, experimental evidence, and visual artifacts across the document lifecycle. Existing language-model generation pipelines rely on unconstrained text synthesis with validation applied only after generation, often producing structural drift, missing figures or tables, and cross-section inconsistencies. We introduce Story2Proposal, a contract-governed multi-agent framework that converts a research story into a structured manuscript through coordinated agents operating under a persistent shared visual contract. The system organizes architect, writer, refiner, and renderer agents around a contract state that tracks section structure and registered visual elements, while evaluation agents supply feedback in a generate evaluate adapt loop that updates the contract during generation. Experiments on tasks derived from the Jericho research corpus show that Story2Proposal achieved an expert evaluation score of 6.145 versus 3.963 for DirectChat (+2.182) across GPT, Claude, Gemini, and Qwen backbones. Compared with the structured generation baseline Fars, Story2Proposal obtained an average score of 5.705 versus 5.197, indicating improved structural consistency and visual alignment.