ChatPaper.aiChatPaper

Grands Modèles de Langage pour la Génération d'Idées Scientifiques : Une Étude Centrée sur la Créativité

Large Language Models for Scientific Idea Generation: A Creativity-Centered Survey

November 5, 2025
papers.authors: Fatemeh Shahhosseini, Arash Marioriyad, Ali Momen, Mahdieh Soleymani Baghshah, Mohammad Hossein Rohban, Shaghayegh Haghjooy Javanmard
cs.AI

papers.abstract

La génération d'idées scientifiques est au cœur de la découverte scientifique et a propulsé le progrès humain – que ce soit en résolvant des problèmes non résolus ou en proposant de nouvelles hypothèses pour expliquer des phénomènes inconnus. Contrairement au raisonnement scientifique standard ou à la génération créative générale, la génération d'idées en science est une tâche multi-objectifs et ouverte, où la nouveauté d'une contribution est aussi essentielle que sa solidité empirique. Les grands modèles de langage (LLM) ont récemment émergé comme des générateurs prometteurs d'idées scientifiques, capables de produire des résultats cohérents et factuels avec une intuition surprenante et un raisonnement acceptable, mais leur capacité créative reste inconstante et mal comprise. Cette synthèse propose une structuration des méthodes pour l'idéation scientifique pilotée par les LLM, en examinant comment différentes approches équilibrent créativité et rigueur scientifique. Nous catégorisons les méthodes existantes en cinq familles complémentaires : l'augmentation par connaissances externes, l'orientation distributionnelle par prompt, la mise à l'échelle lors de l'inférence, la collaboration multi-agents et l'adaptation au niveau des paramètres. Pour interpréter leurs contributions, nous utilisons deux cadres complémentaires : la taxonomie de Boden sur la créativité combinatoire, exploratoire et transformationnelle pour caractériser le niveau d'idées que chaque famille est censée générer, et le cadre des 4P de Rhodes – Personne, Processus, Pression environnementale et Produit – pour situer l'aspect ou la source de créativité que chaque méthode privilégie. En alignant les avancées méthodologiques sur les cadres de la créativité, cette synthèse clarifie l'état du domaine et esquisse les directions clés vers des applications fiables, systématiques et transformationnelles des LLM dans la découverte scientifique.
English
Scientific idea generation lies at the heart of scientific discovery and has driven human progress-whether by solving unsolved problems or proposing novel hypotheses to explain unknown phenomena. Unlike standard scientific reasoning or general creative generation, idea generation in science is a multi-objective and open-ended task, where the novelty of a contribution is as essential as its empirical soundness. Large language models (LLMs) have recently emerged as promising generators of scientific ideas, capable of producing coherent and factual outputs with surprising intuition and acceptable reasoning, yet their creative capacity remains inconsistent and poorly understood. This survey provides a structured synthesis of methods for LLM-driven scientific ideation, examining how different approaches balance creativity with scientific soundness. We categorize existing methods into five complementary families: External knowledge augmentation, Prompt-based distributional steering, Inference-time scaling, Multi-agent collaboration, and Parameter-level adaptation. To interpret their contributions, we employ two complementary frameworks: Boden's taxonomy of Combinatorial, Exploratory and Transformational creativity to characterize the level of ideas each family expected to generate, and Rhodes' 4Ps framework-Person, Process, Press, and Product-to locate the aspect or source of creativity that each method emphasizes. By aligning methodological advances with creativity frameworks, this survey clarifies the state of the field and outlines key directions toward reliable, systematic, and transformative applications of LLMs in scientific discovery.
PDF22December 1, 2025