Spacer: 엔지니어링된 과학적 영감을 향하여
Spacer: Towards Engineered Scientific Inspiration
August 25, 2025
저자: Minhyeong Lee, Suyoung Hwang, Seunghyun Moon, Geonho Nah, Donghyun Koh, Youngjun Cho, Johyun Park, Hojin Yoo, Jiho Park, Haneul Choi, Sungbin Moon, Taehoon Hwang, Seungwon Kim, Jaeyeong Kim, Seongjun Kim, Juneau Jung
cs.AI
초록
최근 대형 언어 모델(LLM)의 발전으로 인해 자동화된 과학 연구는 인공 초지능으로 가는 길에서 다음 전선이 되었습니다. 그러나 이러한 시스템들은 좁은 범위의 작업이나 LLM의 제한된 창의적 능력에 묶여 있습니다. 우리는 외부 개입 없이 창의적이고 사실에 기반한 개념을 개발하는 과학적 발견 시스템인 Spacer를 제안합니다. Spacer는 '의도적인 탈문맥화'라는 접근 방식을 통해 이를 달성하려고 합니다. 이 접근 방식은 정보를 원자 단위인 키워드로 분해하고, 이들 간의 탐구되지 않은 연결에서 창의성을 도출합니다. Spacer는 (i) 키워드 세트를 구축하는 영감 엔진인 Nuri와 (ii) 이러한 세트를 정교한 과학적 진술로 다듬는 Manifesting Pipeline으로 구성됩니다. Nuri는 생물학 분야의 180,000편의 학술 논문으로 구축된 키워드 그래프에서 새롭고 잠재력이 높은 키워드 세트를 추출합니다. Manifesting Pipeline은 키워드 간의 연결을 찾고, 그들의 논리적 구조를 분석하며, 타당성을 검증하고, 궁극적으로 독창적인 과학적 개념을 초안으로 작성합니다. 우리의 실험에 따르면, Nuri의 평가 지표는 AUROC 점수 0.737로 고영향력 논문을 정확하게 분류합니다. 또한, Manifesting Pipeline은 최신 최상위 저널 논문의 핵심 개념을 키워드 세트만으로 성공적으로 재구성합니다. LLM 기반 채점 시스템은 이 재구성이 85% 이상의 경우에서 타당하다고 추정합니다. 마지막으로, 우리의 임베딩 공간 분석은 Spacer의 출력이 최첨단 LLM의 출력보다 선도적인 논문들과 훨씬 더 유사함을 보여줍니다.
English
Recent advances in LLMs have made automated scientific research the next
frontline in the path to artificial superintelligence. However, these systems
are bound either to tasks of narrow scope or the limited creative capabilities
of LLMs. We propose Spacer, a scientific discovery system that develops
creative and factually grounded concepts without external intervention. Spacer
attempts to achieve this via 'deliberate decontextualization,' an approach that
disassembles information into atomic units - keywords - and draws creativity
from unexplored connections between them. Spacer consists of (i) Nuri, an
inspiration engine that builds keyword sets, and (ii) the Manifesting Pipeline
that refines these sets into elaborate scientific statements. Nuri extracts
novel, high-potential keyword sets from a keyword graph built with 180,000
academic publications in biological fields. The Manifesting Pipeline finds
links between keywords, analyzes their logical structure, validates their
plausibility, and ultimately drafts original scientific concepts. According to
our experiments, the evaluation metric of Nuri accurately classifies
high-impact publications with an AUROC score of 0.737. Our Manifesting Pipeline
also successfully reconstructs core concepts from the latest top-journal
articles solely from their keyword sets. An LLM-based scoring system estimates
that this reconstruction was sound for over 85% of the cases. Finally, our
embedding space analysis shows that outputs from Spacer are significantly more
similar to leading publications compared with those from SOTA LLMs.