PiFlow : Découverte scientifique guidée par les principes grâce à la collaboration multi-agent
PiFlow: Principle-aware Scientific Discovery with Multi-Agent Collaboration
May 21, 2025
Auteurs: Yingming Pu, Tao Lin, Hongyu Chen
cs.AI
Résumé
Les systèmes multi-agents (MAS) basés sur des modèles de langage de grande taille (LLM) démontrent un potentiel remarquable pour la découverte scientifique. Cependant, les approches existantes automatisent souvent la découverte scientifique en utilisant des workflows prédéfinis qui manquent de contraintes de rationalité. Cela conduit fréquemment à des hypothèses sans but et à un échec à relier systématiquement les hypothèses avec des preuves, entravant ainsi la réduction systématique de l'incertitude. Surmonter ces limitations nécessite fondamentalement une réduction systématique de l'incertitude. Nous présentons PiFlow, un cadre informationnel, traitant la découverte scientifique automatisée comme un problème structuré de réduction de l'incertitude guidé par des principes (par exemple, les lois scientifiques). Dans les évaluations menées dans trois domaines scientifiques distincts — la découverte de structures de nanomatériaux, de biomolécules et de candidats supraconducteurs avec des propriétés ciblées — notre méthode améliore significativement l'efficacité de la découverte, reflétée par une augmentation de 73,55 % de l'aire sous la courbe (AUC) des valeurs de propriétés par rapport aux étapes d'exploration, et améliore la qualité des solutions de 94,06 % par rapport à un système d'agents classique. Globalement, PiFlow sert de méthode Plug-and-Play, établissant un nouveau changement de paradigme dans la découverte scientifique automatisée hautement efficace, ouvrant la voie à une recherche accélérée et plus robuste pilotée par l'IA. Le code est disponible publiquement sur notre {GitHub} https://github.com/amair-lab/PiFlow.
English
Large Language Model (LLM)-based multi-agent systems (MAS) demonstrate
remarkable potential for scientific discovery. Existing approaches, however,
often automate scientific discovery using predefined workflows that lack
rationality constraints. This often leads to aimless hypothesizing and a
failure to consistently link hypotheses with evidence, thereby hindering
systematic uncertainty reduction. Overcoming these limitations fundamentally
requires systematic uncertainty reduction. We introduce PiFlow, an
information-theoretical framework, treating automated scientific discovery as a
structured uncertainty reduction problem guided by principles (e.g., scientific
laws). In evaluations across three distinct scientific domains -- discovering
nanomaterial structures, bio-molecules, and superconductor candidates with
targeted properties -- our method significantly improves discovery efficiency,
reflected by a 73.55\% increase in the Area Under the Curve (AUC) of property
values versus exploration steps, and enhances solution quality by 94.06\%
compared to a vanilla agent system. Overall, PiFlow serves as a
Plug-and-Play method, establishing a novel paradigm shift in highly efficient
automated scientific discovery, paving the way for more robust and accelerated
AI-driven research. Code is publicly available at our
https://github.com/amair-lab/PiFlow{GitHub}.Summary
AI-Generated Summary