ChatPaper.aiChatPaper

CHIMERA: 과학 문헌 내 아이디어 재조합 지식 베이스

CHIMERA: A Knowledge Base of Idea Recombination in Scientific Literature

May 27, 2025
저자: Noy Sternlicht, Tom Hope
cs.AI

초록

인간의 혁신의 특징은 재조합 과정에 있다. 이는 기존 메커니즘과 개념의 요소를 통합하여 독창적인 아이디어를 창출하는 과정이다. 본 연구에서는 과학 문헌을 자동으로 탐색하고 CHIMERA라는 대규모 재조합 예시 지식 기반(KB)을 구축한다. CHIMERA는 과학자들이 어떻게 개념을 재조합하고 다양한 분야에서 영감을 얻는지를 대규모로 실증적으로 탐구하거나, 새로운 창의적인 교차 분야 방향을 예측하는 지도 학습 모델을 훈련하는 데 사용될 수 있다. 이 KB를 구축하기 위해, 우리는 과학 논문 초록에서 재조합을 추출하는 새로운 정보 추출 작업을 제시하고, 수백 개의 수동으로 주석이 달린 초록으로 구성된 고품질 코퍼스를 수집하며, 이를 사용하여 LLM 기반 추출 모델을 훈련한다. 이 모델은 AI 분야의 대규모 논문 코퍼스에 적용되어 28,000개 이상의 재조합 예시를 포함한 KB를 생성한다. 우리는 CHIMERA를 분석하여 AI의 다양한 하위 분야에서 재조합의 특성을 탐구한다. 마지막으로, 이 KB를 사용하여 과학적 가설 생성 모델을 훈련하며, 이 모델은 실제 연구자들이 영감을 얻는 새로운 재조합 방향을 예측한다. 우리의 데이터와 코드는 https://github.cs.huji.ac.il/tomhope-lab/CHIMERA에서 확인할 수 있다.
English
A hallmark of human innovation is the process of recombination -- creating original ideas by integrating elements of existing mechanisms and concepts. In this work, we automatically mine the scientific literature and build CHIMERA: a large-scale knowledge base (KB) of recombination examples. CHIMERA can be used to empirically explore at scale how scientists recombine concepts and take inspiration from different areas, or to train supervised machine learning models that learn to predict new creative cross-domain directions. To build this KB, we present a novel information extraction task of extracting recombination from scientific paper abstracts, collect a high-quality corpus of hundreds of manually annotated abstracts, and use it to train an LLM-based extraction model. The model is applied to a large corpus of papers in the AI domain, yielding a KB of over 28K recombination examples. We analyze CHIMERA to explore the properties of recombination in different subareas of AI. Finally, we train a scientific hypothesis generation model using the KB, which predicts new recombination directions that real-world researchers find inspiring. Our data and code are available at https://github.cs.huji.ac.il/tomhope-lab/CHIMERA

Summary

AI-Generated Summary

PDF143May 29, 2025