Modelli Linguistici di Grande Scala per la Generazione di Idee Scientifiche: Una Rassegna Centrata sulla Creatività
Large Language Models for Scientific Idea Generation: A Creativity-Centered Survey
November 5, 2025
Autori: Fatemeh Shahhosseini, Arash Marioriyad, Ali Momen, Mahdieh Soleymani Baghshah, Mohammad Hossein Rohban, Shaghayegh Haghjooy Javanmard
cs.AI
Abstract
La generazione di idee scientifiche è al cuore della scoperta scientifica e ha guidato il progresso umano, sia risolvendo problemi irrisolti sia proponendo nuove ipotesi per spiegare fenomeni sconosciuti. A differenza del ragionamento scientifico standard o della generazione creativa generale, la generazione di idee nella scienza è un compito multi-obiettivo e aperto, dove la novità di un contributo è tanto essenziale quanto la sua solidità empirica. I grandi modelli linguistici (LLM) sono recentemente emersi come promettenti generatori di idee scientifiche, capaci di produrre output coerenti e fattuali con sorprendente intuizione e ragionamento accettabile, eppure la loro capacità creativa rimane incostante e poco compresa. Questa rassegna fornisce una sintesi strutturata dei metodi per l'ideazione scientifica guidata da LLM, esaminando come i diversi approcci bilanciano creatività e rigore scientifico. Categorizziamo i metodi esistenti in cinque famiglie complementari: arricchimento di conoscenza esterna, orientamento distribuzionale basato su prompt, scalatura al momento dell'inferenza, collaborazione multi-agente e adattamento a livello di parametri. Per interpretarne i contributi, utilizziamo due framework complementari: la tassonomia di Boden della creatività Combinatoria, Esplorativa e Trasformativa per caratterizzare il livello di idee che ciascuna famiglia si prefigge di generare, e il framework delle 4P di Rhodes - Persona, Processo, Pressione ambientale e Prodotto - per individuare l'aspetto o la fonte della creatività che ciascun metodo enfatizza. Allineando i progressi metodologici con i framework sulla creatività, questa rassegna chiarisce lo stato del campo e delinea le direzioni chiave verso applicazioni affidabili, sistematiche e trasformative degli LLM nella scoperta scientifica.
English
Scientific idea generation lies at the heart of scientific discovery and has driven human progress-whether by solving unsolved problems or proposing novel hypotheses to explain unknown phenomena. Unlike standard scientific reasoning or general creative generation, idea generation in science is a multi-objective and open-ended task, where the novelty of a contribution is as essential as its empirical soundness. Large language models (LLMs) have recently emerged as promising generators of scientific ideas, capable of producing coherent and factual outputs with surprising intuition and acceptable reasoning, yet their creative capacity remains inconsistent and poorly understood. This survey provides a structured synthesis of methods for LLM-driven scientific ideation, examining how different approaches balance creativity with scientific soundness. We categorize existing methods into five complementary families: External knowledge augmentation, Prompt-based distributional steering, Inference-time scaling, Multi-agent collaboration, and Parameter-level adaptation. To interpret their contributions, we employ two complementary frameworks: Boden's taxonomy of Combinatorial, Exploratory and Transformational creativity to characterize the level of ideas each family expected to generate, and Rhodes' 4Ps framework-Person, Process, Press, and Product-to locate the aspect or source of creativity that each method emphasizes. By aligning methodological advances with creativity frameworks, this survey clarifies the state of the field and outlines key directions toward reliable, systematic, and transformative applications of LLMs in scientific discovery.