Intern-Atlas: Методологический граф эволюции как исследовательская инфраструктура для специалистов по искусственному интеллекту
Intern-Atlas: A Methodological Evolution Graph as Research Infrastructure for AI Scientists
April 30, 2026
Авторы: Yujun Wu, Dongxu Zhang, Xinchen Li, Jinhang Xu, Yiling Duan, Yumou Liu, Jiabao Pan, Xuanhe Zhou, Jingxuan Wei, Siyuan Li, Jintao Chen, Conghui He, Cheng Tan
cs.AI
Аннотация
Существующая исследовательская инфраструктура по своей сути ориентирована на документы, предоставляя ссылки на цитирования между статьями, но не имея явных представлений об эволюции методологий. В частности, она не фиксирует структурированные отношения, объясняющие, как и почему исследовательские методы возникают, адаптируются и развиваются на основе друг друга. С появлением ИИ-агентов как нового класса потребителей научных знаний это ограничение становится все более значимым, поскольку такие агенты не могут надежно восстанавливать топологии эволюции методов из неструктурированного текста. Мы представляем Intern-Atlas — граф эволюции методологий, который автоматически идентифицирует сущности на уровне методов, выводит отношения преемственности между методологиями и фиксирует узкие места, стимулирующие переходы между последовательными инновациями. Построенный на основе 1 030 314 статей из конференций по ИИ, научных журналов и препринтов arXiv, результирующий граф содержит 9 410 201 семантически типизированное ребро, каждое из которых основано на дословных свидетельствах из источников, формируя запрашиваемую причинно-следственную сеть методологического развития. Для практического использования этой структуры мы дополнительно предлагаем алгоритм самоконтролируемого временного поиска по дереву для построения цепочек эволюции, отслеживающих прогресс методов во времени. Мы оцениваем качество полученного графа по сравнению с экспертными эталонными цепочками эволюции и наблюдаем высокую степень соответствия. Кроме того, мы демонстрируем, что Intern-Atlas позволяет реализовать приложения для оценки идей и автоматизированной генерации идей. Мы позиционируем графы эволюции методологий как фундаментальный уровень данных для зарождающейся автоматизированной научной деятельности.
English
Existing research infrastructure is fundamentally document-centric, providing citation links between papers but lacking explicit representations of methodological evolution. In particular, it does not capture the structured relationships that explain how and why research methods emerge, adapt, and build upon one another. With the rise of AI-driven research agents as a new class of consumers of scientific knowledge, this limitation becomes increasingly consequential, as such agents cannot reliably reconstruct method evolution topologies from unstructured text. We introduce Intern-Atlas, a methodological evolution graph that automatically identifies method-level entities, infers lineage relationships among methodologies, and captures the bottlenecks that drive transitions between successive innovations. Built from 1,030,314 papers spanning AI conferences, journals, and arXiv preprints, the resulting graph comprises 9,410,201 semantically typed edges, each grounded in verbatim source evidence, forming a queryable causal network of methodological development. To operationalize this structure, we further propose a self-guided temporal tree search algorithm for constructing evolution chains that trace the progression of methods over time. We evaluate the quality of the resulting graph against expert-curated ground-truth evolution chains and observe strong alignment. In addition, we demonstrate that Intern-Atlas enables downstream applications in idea evaluation and automated idea generation. We position methodological evolution graphs as a foundational data layer for the emerging automated scientific discovery.