아이디어2스토리: 연구 개념을 완성된 과학적 서사로 변환하는 자동화 파이프라인
Idea2Story: An Automated Pipeline for Transforming Research Concepts into Complete Scientific Narratives
January 28, 2026
저자: Tengyue Xu, Zhuoyang Qian, Gaoge Liu, Li Ling, Zhentao Zhang, Biao Wu, Shuo Zhang, Ke Lu, Wei Shi, Ziqi Wang, Zheng Feng, Yan Luo, Shu Xu, Yongjin Chen, Zhibo Feng, Zhuo Chen, Bruce Yuan, Harry Wang, Kris Chen
cs.AI
초록
대규모 언어 모델(LLM) 기반 에이전트를 활용한 자율 과학 발견 연구가 최근 상당한 진전을 보이며, 종단간 연구 워크플로우 자동화 능력을 입증하고 있습니다. 그러나 기존 시스템은 대부분 런타임 중심 실행 패러다임에 의존하여 온라인상의 방대한 과학 문헌을 반복적으로 읽고, 요약하고, 추론합니다. 이러한 즉석 계산 전략은 높은 계산 비용을 초래하고, 컨텍스트 윈도우의 한계에 직면하며, 종종 취약한 추론과 환각(hallucination)을 야기합니다. 본 연구에서는 문헌 이해를 온라인 추론에서 오프라인 지식 구축으로 전환하는 자율 과학 발견을 위한 사전 계산 주도 프레임워크인 Idea2Story를 제안합니다. Idea2Story는 동료 검토를 받은 논문과 그 검토 피드백을 지속적으로 수집하고, 핵심 방법론 단위를 추출하며, 재사용 가능한 연구 패턴을 구성하고, 이를 구조화된 방법론 지식 그래프로 체계화합니다. 런타임에는 사용자의 미지정 연구 의도가 확립된 연구 패러다임에 정렬되어, 개방형 생성과 시행착오 대신 고품질 연구 패턴의 효율적인 검색과 재사용이 가능해집니다. 연구 계획 및 실행을 사전 구축된 지식 그래프에 기반함으로써, Idea2Story는 LLM의 컨텍스트 윈도우 병목 현상을 완화하고 문헌에 대한 반복적인 런타임 추론을 크게 줄입니다. 우리는 Idea2Story가 일관성 있고 방법론적으로 근거 있으며 새로운 연구 패턴을 생성할 수 있으며, 종단간 환경에서 여러 고품질 연구 데모를 산출할 수 있음을 보여주는 정성적 분석과 예비 실증 연구를 수행했습니다. 이러한 결과는 오프라인 지식 구축이 신뢰할 수 있는 자율 과학 발견을 위한 실용적이고 확장 가능한 기반을 제공함을 시사합니다.
English
Autonomous scientific discovery with large language model (LLM)-based agents has recently made substantial progress, demonstrating the ability to automate end-to-end research workflows. However, existing systems largely rely on runtime-centric execution paradigms, repeatedly reading, summarizing, and reasoning over large volumes of scientific literature online. This on-the-spot computation strategy incurs high computational cost, suffers from context window limitations, and often leads to brittle reasoning and hallucination. We propose Idea2Story, a pre-computation-driven framework for autonomous scientific discovery that shifts literature understanding from online reasoning to offline knowledge construction. Idea2Story continuously collects peer-reviewed papers together with their review feedback, extracts core methodological units, composes reusable research patterns, and organizes them into a structured methodological knowledge graph. At runtime, underspecified user research intents are aligned to established research paradigms, enabling efficient retrieval and reuse of high-quality research patterns instead of open-ended generation and trial-and-error. By grounding research planning and execution in a pre-built knowledge graph, Idea2Story alleviates the context window bottleneck of LLMs and substantially reduces repeated runtime reasoning over literature. We conduct qualitative analyses and preliminary empirical studies demonstrating that Idea2Story can generate coherent, methodologically grounded, and novel research patterns, and can produce several high-quality research demonstrations in an end-to-end setting. These results suggest that offline knowledge construction provides a practical and scalable foundation for reliable autonomous scientific discovery.