Story2Proposal : Un Échafaudage pour la Rédaction Structurée d'Articles Scientifiques
Story2Proposal: A Scaffold for Structured Scientific Paper Writing
March 28, 2026
Auteurs: Zhuoyang Qian, Wei Shi, Xu Lin, Li Ling, Meng Luo, Ziming Wang, Zhiwei Zhang, Tengyue Xu, Gaoge Liu, Zhentao Zhang, Shuo Zhang, Ziqi Wang, Zheng Feng, Yan Luo, Shu Xu, Yongjin Chen, Zhibo Feng, Zhuo Chen, Bruce Yuan, Biao Wu, Harry Wang, Kris Chen
cs.AI
Résumé
La génération de manuscrits scientifiques nécessite de maintenir un alignement entre le raisonnement narratif, les preuves expérimentales et les artefacts visuels tout au long du cycle de vie du document. Les pipelines de génération par modèles de langage existants reposent sur une synthèse de texte non contrainte avec une validation appliquée uniquement après la génération, produisant souvent des dérives structurelles, des figures ou tableaux manquants, et des incohérences entre les sections. Nous présentons Story2Proposal, un cadre multi-agents régulé par contrat qui convertit un récit de recherche en un manuscrit structuré via des agents coordonnés opérant sous un contrat visuel partagé persistant. Le système organise des agents architecte, rédacteur, affineur et rendu autour d'un état contractuel qui suit la structure des sections et les éléments visuels enregistrés, tandis que des agents d'évaluation fournissent des retours dans une boucle générer-évaluer-adapter qui met à jour le contrat durant la génération. Les expériences sur des tâches dérivées du corpus de recherche Jericho montrent que Story2Proposal a obtenu un score d'évaluation expert de 6,145 contre 3,963 pour DirectChat (+2,182) sur des moteurs GPT, Claude, Gemini et Qwen. Comparé à la baseline de génération structurée Fars, Story2Proposal a obtenu un score moyen de 5,705 contre 5,197, indiquant une meilleure cohérence structurelle et un meilleur alignement visuel.
English
Generating scientific manuscripts requires maintaining alignment between narrative reasoning, experimental evidence, and visual artifacts across the document lifecycle. Existing language-model generation pipelines rely on unconstrained text synthesis with validation applied only after generation, often producing structural drift, missing figures or tables, and cross-section inconsistencies. We introduce Story2Proposal, a contract-governed multi-agent framework that converts a research story into a structured manuscript through coordinated agents operating under a persistent shared visual contract. The system organizes architect, writer, refiner, and renderer agents around a contract state that tracks section structure and registered visual elements, while evaluation agents supply feedback in a generate evaluate adapt loop that updates the contract during generation. Experiments on tasks derived from the Jericho research corpus show that Story2Proposal achieved an expert evaluation score of 6.145 versus 3.963 for DirectChat (+2.182) across GPT, Claude, Gemini, and Qwen backbones. Compared with the structured generation baseline Fars, Story2Proposal obtained an average score of 5.705 versus 5.197, indicating improved structural consistency and visual alignment.