ChatPaper.aiChatPaper

Story2Proposal: 체계적 과학 논문 작성을 위한 지원 프레임워크

Story2Proposal: A Scaffold for Structured Scientific Paper Writing

March 28, 2026
저자: Zhuoyang Qian, Wei Shi, Xu Lin, Li Ling, Meng Luo, Ziming Wang, Zhiwei Zhang, Tengyue Xu, Gaoge Liu, Zhentao Zhang, Shuo Zhang, Ziqi Wang, Zheng Feng, Yan Luo, Shu Xu, Yongjin Chen, Zhibo Feng, Zhuo Chen, Bruce Yuan, Biao Wu, Harry Wang, Kris Chen
cs.AI

초록

과학적 원고 생성은 문서 라이프사이클 전반에 걸쳐 서술적 논리, 실험적 증거, 시각적 자료 간의 일관성을 유지해야 합니다. 기존 언어 모델 생성 파이프라인은 제약 없는 텍스트 합성에 의존하며 검증이 생성 후에만 적용되기 때문에 구조적 일관성 상실, 그림 또는 표 누락, 영역 간 불일치가 빈번히 발생합니다. 본 연구에서는 연구 스토리를 구조화된 원고로 변환하는 계약 기반 다중 에이전트 프레임워크인 Story2Proposal을 제안합니다. 이 시스템은 지속적 공유 시각 계약 하에 조율된 에이전트들을 통해 작동하며, 섹션 구조와 등록된 시각 요소를 추적하는 계약 상태를 중심으로 설계자, 작성자, 정제자, 렌더러 에이전트를 구성합니다. 또한 평가 에이전트들이 생성-평가-적응 루프에서 피드백을 제공하여 생성 과정 중 계약을 지속적으로 갱신합니다. Jericho 연구 코퍼스 기반 작업에 대한 실험에서 Story2Proposal은 GPT, Claude, Gemini, Qwen 백본에서 DirectChat 대비 전문가 평가 점수 6.145점(대조군 3.963점, +2.182)을 달성했습니다. 구조적 생성 기준선인 Fars와 비교 시 Story2Proposal은 평균 5.705점(Fars 5.197점)으로 향상된 구조 일관성과 시각 정렬성을 입증했습니다.
English
Generating scientific manuscripts requires maintaining alignment between narrative reasoning, experimental evidence, and visual artifacts across the document lifecycle. Existing language-model generation pipelines rely on unconstrained text synthesis with validation applied only after generation, often producing structural drift, missing figures or tables, and cross-section inconsistencies. We introduce Story2Proposal, a contract-governed multi-agent framework that converts a research story into a structured manuscript through coordinated agents operating under a persistent shared visual contract. The system organizes architect, writer, refiner, and renderer agents around a contract state that tracks section structure and registered visual elements, while evaluation agents supply feedback in a generate evaluate adapt loop that updates the contract during generation. Experiments on tasks derived from the Jericho research corpus show that Story2Proposal achieved an expert evaluation score of 6.145 versus 3.963 for DirectChat (+2.182) across GPT, Claude, Gemini, and Qwen backbones. Compared with the structured generation baseline Fars, Story2Proposal obtained an average score of 5.705 versus 5.197, indicating improved structural consistency and visual alignment.
PDF92April 1, 2026