Spacer: Auf dem Weg zur gezielten wissenschaftlichen Inspiration
Spacer: Towards Engineered Scientific Inspiration
August 25, 2025
papers.authors: Minhyeong Lee, Suyoung Hwang, Seunghyun Moon, Geonho Nah, Donghyun Koh, Youngjun Cho, Johyun Park, Hojin Yoo, Jiho Park, Haneul Choi, Sungbin Moon, Taehoon Hwang, Seungwon Kim, Jaeyeong Kim, Seongjun Kim, Juneau Jung
cs.AI
papers.abstract
Jüngste Fortschritte bei großen Sprachmodellen (LLMs) haben die automatisierte wissenschaftliche Forschung zur nächsten Frontlinie auf dem Weg zur künstlichen Superintelligenz gemacht. Allerdings sind diese Systeme entweder auf Aufgaben mit begrenztem Umfang oder auf die eingeschränkten kreativen Fähigkeiten von LLMs beschränkt. Wir stellen Spacer vor, ein wissenschaftliches Entdeckungssystem, das kreative und faktenbasierte Konzepte ohne externe Intervention entwickelt. Spacer versucht dies durch „bewusste Dekontextualisierung“ zu erreichen, einen Ansatz, der Informationen in atomare Einheiten – Schlüsselwörter – zerlegt und Kreativität aus unerforschten Verbindungen zwischen ihnen schöpft. Spacer besteht aus (i) Nuri, einer Inspirationsmaschine, die Schlüsselwortgruppen erstellt, und (ii) der Manifesting Pipeline, die diese Gruppen in ausgefeilte wissenschaftliche Aussagen verfeinert. Nuri extrahiert neuartige, vielversprechende Schlüsselwortgruppen aus einem Schlüsselwortgraphen, der mit 180.000 akademischen Publikationen aus biologischen Fachgebieten erstellt wurde. Die Manifesting Pipeline findet Verbindungen zwischen Schlüsselwörtern, analysiert ihre logische Struktur, überprüft ihre Plausibilität und entwirft schließlich originelle wissenschaftliche Konzepte. Laut unseren Experimenten klassifiziert das Bewertungsmetrik von Nuri hochrangige Publikationen mit einem AUROC-Score von 0,737 genau. Unsere Manifesting Pipeline rekonstruiert auch erfolgreich Kernkonzepte aus den neuesten Artikeln führender Fachzeitschriften allein anhand ihrer Schlüsselwortgruppen. Ein LLM-basiertes Bewertungssystem schätzt, dass diese Rekonstruktion in über 85 % der Fälle korrekt war. Schließlich zeigt unsere Analyse des Embedding-Raums, dass die Ausgaben von Spacer im Vergleich zu denen von State-of-the-Art-LLMs deutlich ähnlicher zu führenden Publikationen sind.
English
Recent advances in LLMs have made automated scientific research the next
frontline in the path to artificial superintelligence. However, these systems
are bound either to tasks of narrow scope or the limited creative capabilities
of LLMs. We propose Spacer, a scientific discovery system that develops
creative and factually grounded concepts without external intervention. Spacer
attempts to achieve this via 'deliberate decontextualization,' an approach that
disassembles information into atomic units - keywords - and draws creativity
from unexplored connections between them. Spacer consists of (i) Nuri, an
inspiration engine that builds keyword sets, and (ii) the Manifesting Pipeline
that refines these sets into elaborate scientific statements. Nuri extracts
novel, high-potential keyword sets from a keyword graph built with 180,000
academic publications in biological fields. The Manifesting Pipeline finds
links between keywords, analyzes their logical structure, validates their
plausibility, and ultimately drafts original scientific concepts. According to
our experiments, the evaluation metric of Nuri accurately classifies
high-impact publications with an AUROC score of 0.737. Our Manifesting Pipeline
also successfully reconstructs core concepts from the latest top-journal
articles solely from their keyword sets. An LLM-based scoring system estimates
that this reconstruction was sound for over 85% of the cases. Finally, our
embedding space analysis shows that outputs from Spacer are significantly more
similar to leading publications compared with those from SOTA LLMs.