FlowPIE: Wissenschaftliche Ideenentwicklung zur Testzeit durch flussgesteuerte Literaturerkundung
FlowPIE: Test-Time Scientific Idea Evolution with Flow-Guided Literature Exploration
March 31, 2026
Autoren: Qiyao Wang, Hongbo Wang, Longze Chen, Zhihao Yang, Guhong Chen, Hamid Alinejad-Rokny, Hui Li, Yuan Lin, Min Yang
cs.AI
Zusammenfassung
Die Generierung wissenschaftlicher Ideen (Scientific Idea Generation, SIG) ist entscheidend für KI-gestützte autonome Forschung, doch bestehende Ansätze sind oft durch ein statisches Retrieval-then-Generation-Paradigma eingeschränkt, was zu homogenen und unzureichend divergenten Ideen führt. In dieser Arbeit stellen wir FlowPIE vor, ein eng gekoppeltes Retrieval-Generation-Framework, das Literaturrecherche und Ideengenerierung als einen sich ko-evolutionär entwickelnden Prozess behandelt. FlowPIE erweitert Literaturtrajektorien durch eine flussgeführte Monte-Carlo-Baumsuche (MCTS), inspiriert von GFlowNets, wobei die Qualität aktueller Ideen, bewertet durch ein LLM-basiertes generatives Belohnungsmodell (GRM), als überwachtes Signal zur Steuerung adaptiven Retrievals dient und eine diverse, hochwertige Ausgangspopulation aufbaut. Basierend auf dieser Population modelliert FlowPIE die Ideengenerierung als Testzeit-Ideenevolution, die Selektion, Crossover und Mutation mit dem Isolationsinseln-Paradigma und GRM-basierter Fitnessberechnung anwendet, um domainsübergreifendes Wissen zu integrieren. Es mildert effektiv die Informationssilos, die durch übermäßige Abhängigkeit von parametrischem Wissen und statischer Literatur entstehen. Umfangreiche Evaluationen zeigen, dass FlowPIE durchgängig Ideen mit höherer Neuartigkeit, Umsetzbarkeit und Diversität im Vergleich zu starken LLM-basierten und agentenbasierten Frameworks erzeugt und dabei Belohnungsskalierung während der Testzeit ermöglicht.
English
Scientific idea generation (SIG) is critical to AI-driven autonomous research, yet existing approaches are often constrained by a static retrieval-then-generation paradigm, leading to homogeneous and insufficiently divergent ideas. In this work, we propose FlowPIE, a tightly coupled retrieval-generation framework that treats literature exploration and idea generation as a co-evolving process. FlowPIE expands literature trajectories via a flow-guided Monte Carlo Tree Search (MCTS) inspired by GFlowNets, using the quality of current ideas assessed by an LLM-based generative reward model (GRM) as a supervised signal to guide adaptive retrieval and construct a diverse, high-quality initial population. Based on this population, FlowPIE models idea generation as a test-time idea evolution process, applying selection, crossover, and mutation with the isolation island paradigm and GRM-based fitness computation to incorporate cross-domain knowledge. It effectively mitigates the information cocoons arising from over-reliance on parametric knowledge and static literature. Extensive evaluations demonstrate that FlowPIE consistently produces ideas with higher novelty, feasibility and diversity compared to strong LLM-based and agent-based frameworks, while enabling reward scaling during test time.