EvoScientist: Verso Scienziati IA Multi-Agente in Evoluzione per la Scoperta Scientifica End-to-End

Abstract

La crescente adozione di Large Language Model (LLM) ha consentito agli scienziati dell'IA di svolgere complesse attività di scoperta scientifica end-to-end che richiedono il coordinamento di ruoli specializzati, inclusi la generazione di idee e l'esecuzione sperimentale. Tuttavia, la maggior parte dei sistemi all'avanguardia di scienziati dell'IA si basa su pipeline statiche e progettate manualmente, non riuscendo ad adattarsi in base alle storie di interazione accumulate. Di conseguenza, questi sistemi trascurano promettenti direzioni di ricerca, ripetono esperimenti falliti e perseguono idee non fattibili. Per affrontare questo problema, introduciamo EvoScientist, un framework evolutivo di scienziato dell'IA multi-agente che migliora continuamente le strategie di ricerca attraverso una memoria persistente e l'auto-evoluzione. EvoScientist comprende tre agenti specializzati: un Agente Ricercatore (RA) per la generazione di idee scientifiche, un Agente Ingegnere (EA) per l'implementazione e l'esecuzione degli esperimenti e un Agente Manager dell'Evoluzione (EMA) che distilla le intuizioni dalle interazioni precedenti in conoscenza riutilizzabile. EvoScientist contiene due moduli di memoria persistente: (i) una memoria di ideazione, che riassume le direzioni di ricerca fattibili dalle idee di alto rango registrando al contempo le direzioni precedentemente non riuscite; e (ii) una memoria di sperimentazione, che cattura strategie efficaci di elaborazione dati e addestramento di modelli derivate dalle traiettorie di ricerca del codice e dalle implementazioni dalle migliori performance. Questi moduli consentono all'RA e all'EA di recuperare le strategie precedenti rilevanti, migliorando nel tempo la qualità delle idee e i tassi di successo dell'esecuzione del codice. Gli esperimenti mostrano che EvoScientist supera 7 sistemi all'avanguardia open-source e commerciali nella generazione di idee scientifiche, raggiungendo una maggiore novità, fattibilità, rilevanza e chiarezza attraverso valutazioni automatiche e umane. EvoScientist migliora sostanzialmente anche i tassi di successo dell'esecuzione del codice attraverso l'evoluzione multi-agente, dimostrando l'efficacia della memoria persistente per la scoperta scientifica end-to-end.

English

The increasing adoption of Large Language Models (LLMs) has enabled AI scientists to perform complex end-to-end scientific discovery tasks requiring coordination of specialized roles, including idea generation and experimental execution. However, most state-of-the-art AI scientist systems rely on static, hand-designed pipelines and fail to adapt based on accumulated interaction histories. As a result, these systems overlook promising research directions, repeat failed experiments, and pursue infeasible ideas. To address this, we introduce EvoScientist, an evolving multi-agent AI scientist framework that continuously improves research strategies through persistent memory and self-evolution. EvoScientist comprises three specialized agents: a Researcher Agent (RA) for scientific idea generation, an Engineer Agent (EA) for experiment implementation and execution, and an Evolution Manager Agent (EMA) that distills insights from prior interactions into reusable knowledge. EvoScientist contains two persistent memory modules: (i) an ideation memory, which summarizes feasible research directions from top-ranked ideas while recording previously unsuccessful directions; and (ii) an experimentation memory, which captures effective data processing and model training strategies derived from code search trajectories and best-performing implementations. These modules enable the RA and EA to retrieve relevant prior strategies, improving idea quality and code execution success rates over time. Experiments show that EvoScientist outperforms 7 open-source and commercial state-of-the-art systems in scientific idea generation, achieving higher novelty, feasibility, relevance, and clarity via automatic and human evaluation. EvoScientist also substantially improves code execution success rates through multi-agent evolution, demonstrating persistent memory's effectiveness for end-to-end scientific discovery.

EvoScientist: Verso Scienziati IA Multi-Agente in Evoluzione per la Scoperta Scientifica End-to-End

EvoScientist: Towards Multi-Agent Evolving AI Scientists for End-to-End Scientific Discovery

Abstract

Support