ChatPaper.aiChatPaper

SciAtlas: 자동화된 과학 연구를 위한 대규모 지식 그래프

SciAtlas: A Large-Scale Knowledge Graph for Automated Scientific Research

May 20, 2026
저자: Shuofei Qiao, Yunxiang Wei, Jiazheng Fan, Bin Wu, Busheng Zhang, Mengru Wang, Yuqi Zhu, Ningyu Zhang, Keyan Ding, Qiang Zhang, Huajun Chen
cs.AI

초록

전 세계 학술 산출물의 기하급수적 증가는 연구자와 AI 에이전트에게 전례 없는 '정보 폭발'을 초래했으며, 이로 인해 파편화되고 비구조화된 지식 조직이 심층적인 학제 간 통합을 저해하고 있습니다. 현재의 학술 검색 도구는 주로 표면적인 키워드 매칭이나 벡터 공간 의미 검색에 의존하며, 복잡한 논리적 연결을 탐색하는 데 필요한 위상적 추론 능력이 부족합니다. 에이전트 기반 심층 연구 프레임워크는 종종 논리적 환각에 취약하고 높은 추론 비용을 소모합니다. 이러한 격차를 해소하기 위해, 본 보고서에서는 파노라마적 과학 진화 네트워크로 설계된 대규모의 다학제적·이질적 학술 자원 지식 그래프인 SciAtlas를 소개합니다. 26개 학문 분야의 4,300만 개 이상의 논문, 총 1억 5,700만 개의 엔티티와 30억 개의 트리플렛을 통합함으로써 SciAtlas는 학문적 장벽을 허물고 AI 에이전트에게 글로벌 관점을 제공하는 구조화된 위상적 인지 기반을 제공합니다. 또한, 삼중 경로 협력 검색(tri-path collaborative recall)과 그래프 재순위화(graph reranking)를 특징으로 하는 신경-기호 검색 알고리즘을 개발하여 단순 의미 매칭에서 결정론적 연관성 발견으로의 원활한 전환을 달성합니다. 또 문헌 검토, 자동화된 연구 동향 종합, 아이디어 포지셔닝, 학술 궤적 탐색 등 SciAtlas의 주요 응용 방향을 제시함으로써, SciAtlas가 추론 비용을 크게 줄이면서 자동화된 과학 연구의 전체 루프를 강화하는 효과적인 '인지 지도' 역할을 할 수 있음을 입증합니다. 우리는 GitHub 저장소에서 KG 검색 및 다양한 다운스트림 태스크를 위한 인터페이스를 공개했습니다.
English
The exponential growth of global academic output has confronted researchers and AI agents with an unprecedented ``information explosion,'' where fragmented and unstructured knowledge organization impedes deep interdisciplinary integration. Current academic retrieval tools predominantly rely on superficial keyword matching or vector-space semantic retrieval, which lack the topological reasoning capabilities required to navigate complex logical connections. Agentic deep-research-based frameworks are often prone to logical hallucinations and consuming high inference costs. To bridge this gap, in this report, we introduce SciAtlas, a large-scale, multi-disciplinary, heterogeneous academic resource knowledge graph designed as a panoramic scientific evolution network. By integrating over 43M papers from 26 disciplines, and a total of 157M entities and 3B triplets, SciAtlas provides a structured topological cognitive substrate that dismantles disciplinary barriers and furnishes AI agents with a global perspective. Furthermore, we develop a neuro-symbolic retrieval algorithm featuring tri-path collaborative recall and graph reranking, achieving a seamless transition from simple semantic matching to deterministic association discovery. We also present key application directions of SciAtlas, including literature review, automated research trend synthesis, idea positioning, and academic trajectory exploration, to demonstrate that SciAtlas can serve as an effective ``cognitive map'' to empower the full loop of automated scientific research while significantly reducing reasoning costs. We have released the interfaces for KG retrieval and various downstream tasks in our GitHub repo.