ChatPaper.aiChatPaper

SciAtlas: Ein groß angelegter Wissensgraph für automatisierte wissenschaftliche Forschung

SciAtlas: A Large-Scale Knowledge Graph for Automated Scientific Research

May 20, 2026
Autoren: Shuofei Qiao, Yunxiang Wei, Jiazheng Fan, Bin Wu, Busheng Zhang, Mengru Wang, Yuqi Zhu, Ningyu Zhang, Keyan Ding, Qiang Zhang, Huajun Chen
cs.AI

Zusammenfassung

Das exponentielle Wachstum der globalen akademischen Produktion hat Forscher und KI-Agenten mit einer beispiellosen „Informationsflut“ konfrontiert, bei der fragmentierte und unstrukturierte Wissensorganisation eine tiefe interdisziplinäre Integration behindert. Aktuelle akademische Retrieval-Werkzeuge stützen sich überwiegend auf oberflächlichen Stichwortabgleich oder vektorraumbasierte semantische Suche, denen die für die Navigation komplexer logischer Verbindungen erforderlichen topologischen Schlussfolgerungsfähigkeiten fehlen. Agentische, auf tiefer Forschung basierende Frameworks neigen oft zu logischen Halluzinationen und verursachen hohe Inferenzkosten. Um diese Lücke zu schließen, stellen wir in diesem Bericht SciAtlas vor, einen groß angelegten, multidisziplinären, heterogenen Wissensgraph akademischer Ressourcen, der als panoramisches wissenschaftliches Evolutionsnetzwerk konzipiert ist. Durch die Integration von über 43 Millionen Papern aus 26 Disziplinen sowie insgesamt 157 Millionen Entitäten und 3 Milliarden Triple bietet SciAtlas ein strukturiertes topologisches kognitives Substrat, das Disziplingrenzen auflöst und KI-Agenten mit einer globalen Perspektive ausstattet. Darüber hinaus entwickeln wir einen neuro-symbolischen Retrieval-Algorithmus mit Dreipfad-Kollaborationsabruf und Graph-Neubewertung, der einen nahtlosen Übergang von einfacher semantischer Übereinstimmung zur deterministischen Assoziationserkennung ermöglicht. Wir präsentieren auch wichtige Anwendungsrichtungen von SciAtlas, darunter Literaturüberblick, automatisierte Synthese von Forschungstrends, Ideenpositionierung und Erkundung akademischer Verläufe, um zu demonstrieren, dass SciAtlas als effektive „kognitive Karte“ dienen kann, um den gesamten Kreislauf automatisierter wissenschaftlicher Forschung zu unterstützen und gleichzeitig die Denkkosten erheblich zu senken. Wir haben die Schnittstellen für KG-Abruf und verschiedene nachgelagerte Aufgaben in unserem GitHub-Repository veröffentlicht.
English
The exponential growth of global academic output has confronted researchers and AI agents with an unprecedented ``information explosion,'' where fragmented and unstructured knowledge organization impedes deep interdisciplinary integration. Current academic retrieval tools predominantly rely on superficial keyword matching or vector-space semantic retrieval, which lack the topological reasoning capabilities required to navigate complex logical connections. Agentic deep-research-based frameworks are often prone to logical hallucinations and consuming high inference costs. To bridge this gap, in this report, we introduce SciAtlas, a large-scale, multi-disciplinary, heterogeneous academic resource knowledge graph designed as a panoramic scientific evolution network. By integrating over 43M papers from 26 disciplines, and a total of 157M entities and 3B triplets, SciAtlas provides a structured topological cognitive substrate that dismantles disciplinary barriers and furnishes AI agents with a global perspective. Furthermore, we develop a neuro-symbolic retrieval algorithm featuring tri-path collaborative recall and graph reranking, achieving a seamless transition from simple semantic matching to deterministic association discovery. We also present key application directions of SciAtlas, including literature review, automated research trend synthesis, idea positioning, and academic trajectory exploration, to demonstrate that SciAtlas can serve as an effective ``cognitive map'' to empower the full loop of automated scientific research while significantly reducing reasoning costs. We have released the interfaces for KG retrieval and various downstream tasks in our GitHub repo.