PiFlow: Descubrimiento Científico Basado en Principios con Colaboración Multiagente

Resumen

Los sistemas multiagente (MAS) basados en modelos de lenguaje de gran escala (LLM) demuestran un potencial notable para el descubrimiento científico. Sin embargo, los enfoques existentes suelen automatizar el descubrimiento científico utilizando flujos de trabajo predefinidos que carecen de restricciones de racionalidad. Esto a menudo conduce a una formulación de hipótesis sin rumbo y a una incapacidad para vincular consistentemente las hipótesis con la evidencia, lo que dificulta la reducción sistemática de la incertidumbre. Superar estas limitaciones requiere fundamentalmente una reducción sistemática de la incertidumbre. Presentamos PiFlow, un marco teórico de la información, que trata el descubrimiento científico automatizado como un problema estructurado de reducción de incertidumbre guiado por principios (por ejemplo, leyes científicas). En evaluaciones realizadas en tres dominios científicos distintos —descubrimiento de estructuras de nanomateriales, biomoléculas y candidatos a superconductores con propiedades específicas—, nuestro método mejora significativamente la eficiencia del descubrimiento, reflejada por un aumento del 73.55\% en el Área Bajo la Curva (AUC) de los valores de las propiedades frente a los pasos de exploración, y mejora la calidad de las soluciones en un 94.06\% en comparación con un sistema de agentes básico. En general, PiFlow sirve como un método Plug-and-Play, estableciendo un cambio de paradigma novedoso en el descubrimiento científico automatizado altamente eficiente, allanando el camino para una investigación impulsada por IA más robusta y acelerada. El código está disponible públicamente en nuestro {GitHub} https://github.com/amair-lab/PiFlow.

English

Large Language Model (LLM)-based multi-agent systems (MAS) demonstrate remarkable potential for scientific discovery. Existing approaches, however, often automate scientific discovery using predefined workflows that lack rationality constraints. This often leads to aimless hypothesizing and a failure to consistently link hypotheses with evidence, thereby hindering systematic uncertainty reduction. Overcoming these limitations fundamentally requires systematic uncertainty reduction. We introduce PiFlow, an information-theoretical framework, treating automated scientific discovery as a structured uncertainty reduction problem guided by principles (e.g., scientific laws). In evaluations across three distinct scientific domains -- discovering nanomaterial structures, bio-molecules, and superconductor candidates with targeted properties -- our method significantly improves discovery efficiency, reflected by a 73.55\% increase in the Area Under the Curve (AUC) of property values versus exploration steps, and enhances solution quality by 94.06\% compared to a vanilla agent system. Overall, PiFlow serves as a Plug-and-Play method, establishing a novel paradigm shift in highly efficient automated scientific discovery, paving the way for more robust and accelerated AI-driven research. Code is publicly available at our https://github.com/amair-lab/PiFlow{GitHub}.

PiFlow: Descubrimiento Científico Basado en Principios con Colaboración Multiagente

PiFlow: Principle-aware Scientific Discovery with Multi-Agent Collaboration

Resumen

Support