Intern-Atlas: Een methodologische evolutiegrafiek als onderzoeksinfrastructuur voor AI-wetenschappers
Intern-Atlas: A Methodological Evolution Graph as Research Infrastructure for AI Scientists
April 30, 2026
Auteurs: Yujun Wu, Dongxu Zhang, Xinchen Li, Jinhang Xu, Yiling Duan, Yumou Liu, Jiabao Pan, Xuanhe Zhou, Jingxuan Wei, Siyuan Li, Jintao Chen, Conghui He, Cheng Tan
cs.AI
Samenvatting
De bestaande onderzoeksinfrastructuur is fundamenteel documentgericht: ze biedt citatiekoppelingen tussen artikelen, maar mist expliciete representaties van methodologische evolutie. In het bijzonder legt ze de gestructureerde relaties niet vast die verklaren hoe en waarom onderzoeksmethoden ontstaan, zich aanpassen en op elkaar voortbouwen. Met de opkomst van AI-gestuurde onderzoeksagenten als een nieuwe categorie gebruikers van wetenschappelijke kennis wordt deze beperking steeds belangrijker, aangezien dergelijke agenten niet betrouwbaar methodologie-evolutietopologieën kunnen reconstrueren uit ongestructureerde tekst. Wij introduceren Intern-Atlas, een methodologie-evolutiegraaf die automatisch methodeniveau-entiteiten identificeert, afstammingsrelaties tussen methodologieën afleidt en de knelpunten vastlegt die overgangen tussen opeenvolgende innovaties aandrijven. Opgebouwd uit 1.030.314 artikelen van AI-conferenties, tijdschriften en arXiv-preprints, omvat de resulterende graaf 9.410.201 semantisch getypeerde edges, elk verankerd in letterlijk bronbewijs, en vormt zo een bevraagbaar causaal netwerk van methodologische ontwikkeling. Om deze structuur operationeel te maken, stellen we verder een zelfgestuurd tijdelijk boomzoekalgoritme voor voor het construeren van evolutieketens die de voortgang van methoden in de tijd traceren. We evalueren de kwaliteit van de resulterende graaf aan de hand van door experts samengestelde grondwaarheid-evolutieketens en constateren een sterke overeenkomst. Daarnaast tonen we aan dat Intern-Atlas downstream-toepassingen mogelijk maakt op het gebied van ideeënevaluatie en geautomatiseerde ideeëngeneratie. Wij positioneren methodologie-evolutiegrafieken als een fundamentele datalaag voor de opkomende geautomatiseerde wetenschappelijke ontdekking.
English
Existing research infrastructure is fundamentally document-centric, providing citation links between papers but lacking explicit representations of methodological evolution. In particular, it does not capture the structured relationships that explain how and why research methods emerge, adapt, and build upon one another. With the rise of AI-driven research agents as a new class of consumers of scientific knowledge, this limitation becomes increasingly consequential, as such agents cannot reliably reconstruct method evolution topologies from unstructured text. We introduce Intern-Atlas, a methodological evolution graph that automatically identifies method-level entities, infers lineage relationships among methodologies, and captures the bottlenecks that drive transitions between successive innovations. Built from 1,030,314 papers spanning AI conferences, journals, and arXiv preprints, the resulting graph comprises 9,410,201 semantically typed edges, each grounded in verbatim source evidence, forming a queryable causal network of methodological development. To operationalize this structure, we further propose a self-guided temporal tree search algorithm for constructing evolution chains that trace the progression of methods over time. We evaluate the quality of the resulting graph against expert-curated ground-truth evolution chains and observe strong alignment. In addition, we demonstrate that Intern-Atlas enables downstream applications in idea evaluation and automated idea generation. We position methodological evolution graphs as a foundational data layer for the emerging automated scientific discovery.