베이지안 최적화를 통한 효율적이고 원칙적인 과학적 발견: 튜토리얼
Efficient and Principled Scientific Discovery through Bayesian Optimization: A Tutorial
April 1, 2026
저자: Zhongwei Yu, Rasul Tutunov, Alexandre Max Maraval, Zikai Xie, Zhenzhi Tan, Jiankang Wang, Zijing Li, Liangliang Xu, Qi Yang, Jun Jiang, Sanzhong Luo, Zhenxiao Guo, Haitham Bou-Ammar, Jun Wang
cs.AI
초록
전통적인 과학적 발견은 수세기 동안 발전을 이끌어 온 가설-실험-정교화의 반복적 순환에 의존해 왔으나, 이와 같은 직관적이고 임시적인 실행 방식은 종종 자원을 낭비하고 비효율적인 설계를 초래하며 중요한 통찰을 놓치게 합니다. 본 튜토리얼은 이러한 과학적 발견의 핵심 순환 과정을 체계화하고 자동화하는 원리 기반의 확률론적 프레임워크인 베이지안 최적화(BO)를 소개합니다. BO는 대리 모델(예: 가우시안 프로세스)을 사용하여 경험적 관찰 결과를 진화하는 가설로 모델링하고, 획득 함수를 통해 실험 선택을 안내함으로써 알려진 지식의 활용과 미개척 영역의 탐색 사이의 균형을 맞춥니다. 이를 통해 추측과 수동적인 시행착오를 제거합니다. 본 튜토리얼에서는 먼저 과학적 발견을 최적화 문제로 재정의한 후, 촉매, 재료 과학, 유기 합성, 분자 발견 분야의 사례 연구를 통해 BO의 핵심 구성 요소, 종단간 워크플로우, 그리고 실제 효용성을 상세히 설명합니다. 또한 과학적 응용을 위한 중요한 기술적 확장, 즉 일괄 실험, 이분산성, 맥락적 최적화, 인간-참여형 통합 등도 다룹니다. 다양한 독자를 대상으로 하는 본 튜토리얼은 BO 분야의 인공지능 발전과 실제 자연과학 응용을 연결하며, 단계별 구성된 내용을 통해 학제간 연구자들이 보다 효율적인 실험을 설계하고 원칙에 기반한 과학적 발견을 가속화할 수 있도록 돕고자 합니다.
English
Traditional scientific discovery relies on an iterative hypothesise-experiment-refine cycle that has driven progress for centuries, but its intuitive, ad-hoc implementation often wastes resources, yields inefficient designs, and misses critical insights. This tutorial presents Bayesian Optimisation (BO), a principled probability-driven framework that formalises and automates this core scientific cycle. BO uses surrogate models (e.g., Gaussian processes) to model empirical observations as evolving hypotheses, and acquisition functions to guide experiment selection, balancing exploitation of known knowledge and exploration of uncharted domains to eliminate guesswork and manual trial-and-error. We first frame scientific discovery as an optimisation problem, then unpack BO's core components, end-to-end workflows, and real-world efficacy via case studies in catalysis, materials science, organic synthesis, and molecule discovery. We also cover critical technical extensions for scientific applications, including batched experimentation, heteroscedasticity, contextual optimisation, and human-in-the-loop integration. Tailored for a broad audience, this tutorial bridges AI advances in BO with practical natural science applications, offering tiered content to empower cross-disciplinary researchers to design more efficient experiments and accelerate principled scientific discovery.