ChatPaper.aiChatPaper

인턴-아틀라스: AI 과학자들을 위한 연구 인프라로서의 방법론 진화 그래프

Intern-Atlas: A Methodological Evolution Graph as Research Infrastructure for AI Scientists

April 30, 2026
저자: Yujun Wu, Dongxu Zhang, Xinchen Li, Jinhang Xu, Yiling Duan, Yumou Liu, Jiabao Pan, Xuanhe Zhou, Jingxuan Wei, Siyuan Li, Jintao Chen, Conghui He, Cheng Tan
cs.AI

초록

기존 연구 인프라는 근본적으로 문서 중심으로 설계되어 논문 간 인용 링크는 제공하지만 방법론 진화의 명시적 표현이 부족합니다. 특히 연구 방법이 어떻게, 왜 등장하고 적응하며 상호 발전하는지 설명하는 구조화된 관계를 포착하지 못합니다. 과학 지식의 새로운 소비 계층으로 부상하는 AI 기반 연구 에이전트 시대에 이러한 한계는 점점 더 중대한 문제가 되는데, 이러한 에이전트들은 비정형 텍스트만으로 방법론 진화 토폴로지를 안정적으로 재구성할 수 없기 때문입니다. 본 연구에서는 방법론 수준의 개체를 자동으로 식별하고 방법론 간 계보 관계를 추론하며 연속적 혁신 간 전환을 주도하는 병목 현상을 포착하는 방법론 진화 그래프인 Intern-Atlas를 소개합니다. AI 학회, 학술지, arXiv 프리프린트에 걸친 1,030,314편의 논문으로 구축된 이 그래프는 각각 원본 출처 증거를 기반으로 하는 9,410,201개의 의미론적 유형 간선으로 구성되며, 방법론 발전의 질의 가능한 인과 관계 네트워크를 형성합니다. 이 구조를 활용하기 위해 시간에 따른 방법론 발전 경로를 추적하는 진화 체인을 구성하는 자율 주도형 시간적 트리 탐색 알고리즘을 추가로 제안합니다. 전문가가 수집한 실제 진화 체인 기준으로 그래프 품질을 평가한 결과 높은 일치도를 확인했습니다. 또한 Intern-Atlas가 아이디어 평가 및 자동화된 아이디어 생성과 같은 다운스트림 애플리케이션을 가능하게 함을 입증합니다. 우리는 방법론 진화 그래프가 부상하는 자동화된 과학 발견을 위한 기초 데이터 계층이 될 것으로 전망합니다.
English
Existing research infrastructure is fundamentally document-centric, providing citation links between papers but lacking explicit representations of methodological evolution. In particular, it does not capture the structured relationships that explain how and why research methods emerge, adapt, and build upon one another. With the rise of AI-driven research agents as a new class of consumers of scientific knowledge, this limitation becomes increasingly consequential, as such agents cannot reliably reconstruct method evolution topologies from unstructured text. We introduce Intern-Atlas, a methodological evolution graph that automatically identifies method-level entities, infers lineage relationships among methodologies, and captures the bottlenecks that drive transitions between successive innovations. Built from 1,030,314 papers spanning AI conferences, journals, and arXiv preprints, the resulting graph comprises 9,410,201 semantically typed edges, each grounded in verbatim source evidence, forming a queryable causal network of methodological development. To operationalize this structure, we further propose a self-guided temporal tree search algorithm for constructing evolution chains that trace the progression of methods over time. We evaluate the quality of the resulting graph against expert-curated ground-truth evolution chains and observe strong alignment. In addition, we demonstrate that Intern-Atlas enables downstream applications in idea evaluation and automated idea generation. We position methodological evolution graphs as a foundational data layer for the emerging automated scientific discovery.
PDF112May 2, 2026