Modelos de Lenguaje a Gran Escala para la Generación de Ideas Científicas: Una Revisión Centrada en la Creatividad
Large Language Models for Scientific Idea Generation: A Creativity-Centered Survey
November 5, 2025
Autores: Fatemeh Shahhosseini, Arash Marioriyad, Ali Momen, Mahdieh Soleymani Baghshah, Mohammad Hossein Rohban, Shaghayegh Haghjooy Javanmard
cs.AI
Resumen
La generación de ideas científicas se encuentra en el corazón del descubrimiento científico y ha impulsado el progreso humano, ya sea resolviendo problemas no resueltos o proponiendo hipótesis novedosas para explicar fenómenos desconocidos. A diferencia del razonamiento científico estándar o la generación creativa general, la generación de ideas en la ciencia es una tarea multiobjetivo y de final abierto, donde la novedad de una contribución es tan esencial como su solidez empírica. Los grandes modelos de lenguaje (LLMs, por sus siglas en inglés) han surgido recientemente como generadores prometedores de ideas científicas, capaces de producir resultados coherentes y factuales con una intuición sorprendente y un razonamiento aceptable; sin embargo, su capacidad creativa sigue siendo inconsistente y poco comprendida. Esta revisión ofrece una síntesis estructurada de los métodos para la ideación científica impulsada por LLMs, examinando cómo los diferentes enfoques equilibran la creatividad con la solidez científica. Clasificamos los métodos existentes en cinco familias complementarias: Aumento de conocimiento externo, Dirección distribucional basada en *prompts*, Escalado en tiempo de inferencia, Colaboración multiagente y Adaptación a nivel de parámetros. Para interpretar sus contribuciones, empleamos dos marcos complementarios: la taxonomía de Boden de creatividad Combinatoria, Exploratoria y Transformacional para caracterizar el nivel de ideas que se espera que genere cada familia, y el marco de las 4P de Rhodes (Persona, Proceso, Presión y Producto) para ubicar el aspecto o fuente de creatividad que cada método enfatiza. Al alinear los avances metodológicos con los marcos de creatividad, esta revisión clarifica el estado del campo y delinea direcciones clave hacia aplicaciones confiables, sistemáticas y transformadoras de los LLMs en el descubrimiento científico.
English
Scientific idea generation lies at the heart of scientific discovery and has driven human progress-whether by solving unsolved problems or proposing novel hypotheses to explain unknown phenomena. Unlike standard scientific reasoning or general creative generation, idea generation in science is a multi-objective and open-ended task, where the novelty of a contribution is as essential as its empirical soundness. Large language models (LLMs) have recently emerged as promising generators of scientific ideas, capable of producing coherent and factual outputs with surprising intuition and acceptable reasoning, yet their creative capacity remains inconsistent and poorly understood. This survey provides a structured synthesis of methods for LLM-driven scientific ideation, examining how different approaches balance creativity with scientific soundness. We categorize existing methods into five complementary families: External knowledge augmentation, Prompt-based distributional steering, Inference-time scaling, Multi-agent collaboration, and Parameter-level adaptation. To interpret their contributions, we employ two complementary frameworks: Boden's taxonomy of Combinatorial, Exploratory and Transformational creativity to characterize the level of ideas each family expected to generate, and Rhodes' 4Ps framework-Person, Process, Press, and Product-to locate the aspect or source of creativity that each method emphasizes. By aligning methodological advances with creativity frameworks, this survey clarifies the state of the field and outlines key directions toward reliable, systematic, and transformative applications of LLMs in scientific discovery.