Efficiënte en Principesvolle Wetenschappelijke Ontdekking door Bayesian Optimalisatie: Een Tutorial
Efficient and Principled Scientific Discovery through Bayesian Optimization: A Tutorial
April 1, 2026
Auteurs: Zhongwei Yu, Rasul Tutunov, Alexandre Max Maraval, Zikai Xie, Zhenzhi Tan, Jiankang Wang, Zijing Li, Liangliang Xu, Qi Yang, Jun Jiang, Sanzhong Luo, Zhenxiao Guo, Haitham Bou-Ammar, Jun Wang
cs.AI
Samenvatting
Traditionele wetenschappelijke ontdekking berust op een iteratieve hypothese-experiment-verfijn cyclus die de vooruitgang eeuwenlang heeft aangedreven. De intuïtieve, ad-hoc implementatie ervan leidt echter vaak tot verspilling van middelen, inefficiënte ontwerpen en het missen van cruciale inzichten. Deze tutorial presenteert Bayesiaanse Optimalisatie (BO), een principieel, op waarschijnlijkheid gebaseerd raamwerk dat deze kernwetenschappelijke cyclus formaliseert en automatiseert. BO gebruikt surrogaatmodellen (zoals Gaussische processen) om empirische observaties te modelleren als evoluerende hypothesen, en acquisitiefuncties om de experimentselectie te sturen. Dit alles om het benutten van bekende kennis en het verkennen van onbekende domeinen in evenwicht te brengen, waardoor gegok en handmatig trial-and-error worden geëlimineerd.
We plaatsen eerst wetenschappelijke ontdekking in een optimalisatiekader, waarna we de kerncomponenten van BO, end-to-end werkstromen en de effectiviteit in de praktijk ontleden aan de hand van casestudies in katalyse, materiaalwetenschappen, organische synthese en molecuulontdekking. We behandelen ook cruciale technische uitbreidingen voor wetenschappelijke toepassingen, zoals batch-experimenten, heteroscedasticiteit, contextuele optimalisatie en integratie van de mens-in-de-lus.
Deze tutorial, afgestemd op een breed publiek, overbrugt de kloof tussen AI-ontwikkelingen in BO en praktische toepassingen in de natuurwetenschappen. Door de inhoud in lagen aan te bieden, stelt het onderzoekers uit verschillende disciplines in staat om efficiëntere experimenten te ontwerpen en principiële wetenschappelijke ontdekking te versnellen.
English
Traditional scientific discovery relies on an iterative hypothesise-experiment-refine cycle that has driven progress for centuries, but its intuitive, ad-hoc implementation often wastes resources, yields inefficient designs, and misses critical insights. This tutorial presents Bayesian Optimisation (BO), a principled probability-driven framework that formalises and automates this core scientific cycle. BO uses surrogate models (e.g., Gaussian processes) to model empirical observations as evolving hypotheses, and acquisition functions to guide experiment selection, balancing exploitation of known knowledge and exploration of uncharted domains to eliminate guesswork and manual trial-and-error. We first frame scientific discovery as an optimisation problem, then unpack BO's core components, end-to-end workflows, and real-world efficacy via case studies in catalysis, materials science, organic synthesis, and molecule discovery. We also cover critical technical extensions for scientific applications, including batched experimentation, heteroscedasticity, contextual optimisation, and human-in-the-loop integration. Tailored for a broad audience, this tutorial bridges AI advances in BO with practical natural science applications, offering tiered content to empower cross-disciplinary researchers to design more efficient experiments and accelerate principled scientific discovery.