Story2Proposal: Ein Gerüst für strukturiertes wissenschaftliches Schreiben
Story2Proposal: A Scaffold for Structured Scientific Paper Writing
March 28, 2026
Autoren: Zhuoyang Qian, Wei Shi, Xu Lin, Li Ling, Meng Luo, Ziming Wang, Zhiwei Zhang, Tengyue Xu, Gaoge Liu, Zhentao Zhang, Shuo Zhang, Ziqi Wang, Zheng Feng, Yan Luo, Shu Xu, Yongjin Chen, Zhibo Feng, Zhuo Chen, Bruce Yuan, Biao Wu, Harry Wang, Kris Chen
cs.AI
Zusammenfassung
Die Erstellung wissenschaftlicher Manuskripte erfordert die Aufrechterhaltung der Kohärenz zwischen narrativer Argumentation, experimentellen Belegen und visuellen Elementen über den gesamten Dokumentenlebenszyklus hinweg. Bestehende Generierungspipelines auf Basis von Sprachmodellen setzen auf unbegrenzte Text synthese, wobei Validierungen erst nach der Generierung erfolgen. Dies führt häufig zu strukturellen Abweichungen, fehlenden Abbildungen oder Tabellen sowie Inkonsistenzen zwischen den Abschnitten. Wir stellen Story2Proposal vor, ein vertragsgesteuertes Multi-Agenten-Framework, das eine Forschungsgeschichte durch koordinierte Agenten, die unter einem persistenten gemeinsamen visuellen Vertrag operieren, in ein strukturiertes Manuskript umwandelt. Das System organisiert Architekten-, Autoren-, Verfeinerungs- und Render-Agenten um einen Vertragsstatus, der die Abschnittsstruktur und registrierte visuelle Elemente verfolgt, während Evaluierungsagenten Feedback in einer „Generieren-Bewerten-Anpassen“-Schleife liefern, die den Vertrag während der Generierung aktualisiert. Experimente mit Aufgaben aus dem Jericho-Forschungskorpus zeigen, dass Story2Proposal eine Expertenbewertung von 6,145 gegenüber 3,963 für DirectChat (+2,182) über GPT-, Claude-, Gemini- und Qwen-Backbones hinweg erzielte. Im Vergleich zur strukturierten Generierungs-Baseline Fars erzielte Story2Proposal einen Durchschnittswert von 5,705 gegenüber 5,197, was auf eine verbesserte strukturelle Konsistenz und visuelle Kohärenz hindeutet.
English
Generating scientific manuscripts requires maintaining alignment between narrative reasoning, experimental evidence, and visual artifacts across the document lifecycle. Existing language-model generation pipelines rely on unconstrained text synthesis with validation applied only after generation, often producing structural drift, missing figures or tables, and cross-section inconsistencies. We introduce Story2Proposal, a contract-governed multi-agent framework that converts a research story into a structured manuscript through coordinated agents operating under a persistent shared visual contract. The system organizes architect, writer, refiner, and renderer agents around a contract state that tracks section structure and registered visual elements, while evaluation agents supply feedback in a generate evaluate adapt loop that updates the contract during generation. Experiments on tasks derived from the Jericho research corpus show that Story2Proposal achieved an expert evaluation score of 6.145 versus 3.963 for DirectChat (+2.182) across GPT, Claude, Gemini, and Qwen backbones. Compared with the structured generation baseline Fars, Story2Proposal obtained an average score of 5.705 versus 5.197, indicating improved structural consistency and visual alignment.