インターン-アトラス:AI科学者のための研究基盤としての方法論的進化グラフ
Intern-Atlas: A Methodological Evolution Graph as Research Infrastructure for AI Scientists
April 30, 2026
著者: Yujun Wu, Dongxu Zhang, Xinchen Li, Jinhang Xu, Yiling Duan, Yumou Liu, Jiabao Pan, Xuanhe Zhou, Jingxuan Wei, Siyuan Li, Jintao Chen, Conghui He, Cheng Tan
cs.AI
要旨
既存の研究インフラは、本質的に文書中心の設計となっており、論文間の引用リンクは提供するものの、方法論の進化を明示的に表現する機能を欠いている。特に、研究方法がどのようにして出現し、適応し、相互に発展するのかを説明する構造化された関係性を捕捉できない。AI駆動型研究エージェントという新たな科学知識の消費者が台頭する中、この制限はますます重大な問題となりつつある。なぜなら、こうしたエージェントは非構造化テキストから方法論の進化トポロジーを確実に再構築できないからである。本論文では、方法論の進化グラフであるIntern-Atlasを提案する。これは、方法論レベルのエンティティを自動的に識別し、方法論間の系統関係を推論し、連続的な革新間の移行を促進するボトルネックを捕捉する。AI分野の会議録、学術誌、arXivプレプリントにわたる1,030,314本の論文から構築されたこのグラフは、9,410,201の意味的にタイプ付けされたエッジから成り、各エッジは原文の証拠に基づいており、方法論的発展の問い合わせ可能な因果ネットワークを形成する。この構造を実用的にするため、時間的ツリー自己誘導探索アルゴリズムをさらに提案し、時間経過に伴う方法論の進展を追跡する進化チェーンを構築する。構築されたグラフの品質を専門家が作成した正解進化チェーンと比較評価した結果、強い一致が確認された。さらに、Intern-Atlasがアイデア評価および自動アイデア生成における下流アプリケーションを可能にすることを実証する。我々は、方法論進化グラフを、新たに登場しつつある自動化科学発見のための基盤的データ層として位置づける。
English
Existing research infrastructure is fundamentally document-centric, providing citation links between papers but lacking explicit representations of methodological evolution. In particular, it does not capture the structured relationships that explain how and why research methods emerge, adapt, and build upon one another. With the rise of AI-driven research agents as a new class of consumers of scientific knowledge, this limitation becomes increasingly consequential, as such agents cannot reliably reconstruct method evolution topologies from unstructured text. We introduce Intern-Atlas, a methodological evolution graph that automatically identifies method-level entities, infers lineage relationships among methodologies, and captures the bottlenecks that drive transitions between successive innovations. Built from 1,030,314 papers spanning AI conferences, journals, and arXiv preprints, the resulting graph comprises 9,410,201 semantically typed edges, each grounded in verbatim source evidence, forming a queryable causal network of methodological development. To operationalize this structure, we further propose a self-guided temporal tree search algorithm for constructing evolution chains that trace the progression of methods over time. We evaluate the quality of the resulting graph against expert-curated ground-truth evolution chains and observe strong alignment. In addition, we demonstrate that Intern-Atlas enables downstream applications in idea evaluation and automated idea generation. We position methodological evolution graphs as a foundational data layer for the emerging automated scientific discovery.