ChatPaper.aiChatPaper

Grootschalige Taalmodellen voor het Genereren van Wetenschappelijke Ideeën: Een Op Creativiteit Gericht Overzicht

Large Language Models for Scientific Idea Generation: A Creativity-Centered Survey

November 5, 2025
Auteurs: Fatemeh Shahhosseini, Arash Marioriyad, Ali Momen, Mahdieh Soleymani Baghshah, Mohammad Hossein Rohban, Shaghayegh Haghjooy Javanmard
cs.AI

Samenvatting

Het genereren van wetenschappelijke ideeën vormt de kern van wetenschappelijke ontdekkingen en heeft de menselijke vooruitgang aangedreven – hetzij door het oplossen van onopgeloste problemen, hetzij door het voorstellen van nieuwe hypothesen om onbekende fenomenen te verklaren. In tegenstelling tot standaard wetenschappelijke redenering of algemene creatieve generatie, is ideeëngeneratie in de wetenschap een multi-objectieve en open-ended taak, waarbij de nieuwswaarde van een bijdrage even essentieel is als haar empirische degelijkheid. Grote taalmodelen (LLM's) zijn recentelijk naar voren gekomen als veelbelovende generatoren van wetenschappelijke ideeën, die in staat zijn tot coherente en feitelijke output met verrassend intuïtie en aanvaardbare redenering, maar hun creatieve capaciteit blijft inconsistent en slecht begrepen. Dit overzicht biedt een gestructureerde synthese van methoden voor LLM-gedreven wetenschappelijke ideevorming, waarbij wordt onderzocht hoe verschillende benaderingen creativiteit combineren met wetenschappelijke degelijkheid. We categoriseren bestaande methoden in vijf complementaire families: Externe kennisaanvulling, Prompt-gebaseerde distributionele sturing, Schaling tijdens inferentie, Multi-agent samenwerking, en Parameter-niveau aanpassing. Om hun bijdragen te interpreteren, gebruiken we twee complementaire kaders: Boden's taxonomie van Combinatorische, Exploratoire en Transformationele creativiteit om het niveau van ideeën te karakteriseren dat elke familie naar verwachting genereert, en Rhodes' 4P-kader – Persoon, Proces, Press en Product – om het aspect of de bron van creativiteit te lokaliseren dat elke methode benadrukt. Door methodologische vooruitgang af te stemmen op creativiteitskaders, verduidelijkt dit overzicht de stand van zaken en schetst het belangrijke richtingen voor betrouwbare, systematische en transformerende toepassingen van LLM's in wetenschappelijke ontdekkingen.
English
Scientific idea generation lies at the heart of scientific discovery and has driven human progress-whether by solving unsolved problems or proposing novel hypotheses to explain unknown phenomena. Unlike standard scientific reasoning or general creative generation, idea generation in science is a multi-objective and open-ended task, where the novelty of a contribution is as essential as its empirical soundness. Large language models (LLMs) have recently emerged as promising generators of scientific ideas, capable of producing coherent and factual outputs with surprising intuition and acceptable reasoning, yet their creative capacity remains inconsistent and poorly understood. This survey provides a structured synthesis of methods for LLM-driven scientific ideation, examining how different approaches balance creativity with scientific soundness. We categorize existing methods into five complementary families: External knowledge augmentation, Prompt-based distributional steering, Inference-time scaling, Multi-agent collaboration, and Parameter-level adaptation. To interpret their contributions, we employ two complementary frameworks: Boden's taxonomy of Combinatorial, Exploratory and Transformational creativity to characterize the level of ideas each family expected to generate, and Rhodes' 4Ps framework-Person, Process, Press, and Product-to locate the aspect or source of creativity that each method emphasizes. By aligning methodological advances with creativity frameworks, this survey clarifies the state of the field and outlines key directions toward reliable, systematic, and transformative applications of LLMs in scientific discovery.
PDF22December 1, 2025