ChatPaper.aiChatPaper

Крупные языковые модели для генерации научных идей: обзор с акцентом на креативность

Large Language Models for Scientific Idea Generation: A Creativity-Centered Survey

November 5, 2025
Авторы: Fatemeh Shahhosseini, Arash Marioriyad, Ali Momen, Mahdieh Soleymani Baghshah, Mohammad Hossein Rohban, Shaghayegh Haghjooy Javanmard
cs.AI

Аннотация

Генерация научных идей лежит в основе научных открытий и движет прогрессом человечества — как через решение нерешённых проблем, так и через выдвижение новых гипотез для объяснения неизвестных явлений. В отличие от стандартных научных рассуждений или общей креативной генерации, генерация идей в науке представляет собой многокритериальную и открытую задачу, где новизна вклада не менее важна, чем его эмпирическая обоснованность. Крупные языковые модели (КЯМ) недавно проявили себя как перспективные генераторы научных идей, способные производить связные и фактологически точные результаты с удивительной интуицией и приемлемой аргументацией, однако их творческий потенциал остаётся нестабильным и слабо изученным. Данный обзор предлагает структурированный синтез методов научного генерирования идей на основе КЯМ, исследуя, как разные подходы балансируют между креативностью и научной строгостью. Мы классифицируем существующие методы в пять взаимодополняющих семейств: расширение внешними знаниями, управление распределением через промпты, масштабирование на этапе вывода, многoагентная коллаборация и адаптация на уровне параметров. Для интерпретации их вклада мы используем две взаимодополняющие концепции: таксономию креативности Боден (комбинаторная, исследовательская и трансформационная) для характеристики уровня идей, ожидаемых от каждого семейства, и модель 4P Роудса (Личность, Процесс, Среда, Продукт) для определения аспекта или источника креативности, на который делает акцент каждый метод. Сопоставляя методологические достижения с концепциями креативности, этот обзор проясняет состояние области и намечает ключевые направления для достижения надёжных, систематических и трансформационных применений КЯМ в научных открытиях.
English
Scientific idea generation lies at the heart of scientific discovery and has driven human progress-whether by solving unsolved problems or proposing novel hypotheses to explain unknown phenomena. Unlike standard scientific reasoning or general creative generation, idea generation in science is a multi-objective and open-ended task, where the novelty of a contribution is as essential as its empirical soundness. Large language models (LLMs) have recently emerged as promising generators of scientific ideas, capable of producing coherent and factual outputs with surprising intuition and acceptable reasoning, yet their creative capacity remains inconsistent and poorly understood. This survey provides a structured synthesis of methods for LLM-driven scientific ideation, examining how different approaches balance creativity with scientific soundness. We categorize existing methods into five complementary families: External knowledge augmentation, Prompt-based distributional steering, Inference-time scaling, Multi-agent collaboration, and Parameter-level adaptation. To interpret their contributions, we employ two complementary frameworks: Boden's taxonomy of Combinatorial, Exploratory and Transformational creativity to characterize the level of ideas each family expected to generate, and Rhodes' 4Ps framework-Person, Process, Press, and Product-to locate the aspect or source of creativity that each method emphasizes. By aligning methodological advances with creativity frameworks, this survey clarifies the state of the field and outlines key directions toward reliable, systematic, and transformative applications of LLMs in scientific discovery.
PDF22December 1, 2025