PiFlow: Descoberta Científica Baseada em Princípios com Colaboração Multiagente
PiFlow: Principle-aware Scientific Discovery with Multi-Agent Collaboration
May 21, 2025
Autores: Yingming Pu, Tao Lin, Hongyu Chen
cs.AI
Resumo
Sistemas multiagentes (MAS) baseados em Large Language Models (LLMs) demonstram um potencial notável para a descoberta científica. No entanto, as abordagens existentes frequentemente automatizam a descoberta científica utilizando fluxos de trabalho predefinidos que carecem de restrições de racionalidade. Isso frequentemente leva a uma formulação de hipóteses sem direção e a uma falha em vincular consistentemente hipóteses com evidências, prejudicando assim a redução sistemática de incertezas. Superar essas limitações requer fundamentalmente uma redução sistemática de incertezas. Introduzimos o PiFlow, um framework baseado na teoria da informação, que trata a descoberta científica automatizada como um problema estruturado de redução de incertezas guiado por princípios (por exemplo, leis científicas). Em avaliações realizadas em três domínios científicos distintos -- descoberta de estruturas de nanomateriais, biomoléculas e candidatos a supercondutores com propriedades específicas -- nosso método melhora significativamente a eficiência da descoberta, refletida por um aumento de 73,55\% na Área Sob a Curva (AUC) dos valores das propriedades em relação às etapas de exploração, e aprimora a qualidade das soluções em 94,06\% em comparação com um sistema de agentes convencional. No geral, o PiFlow serve como um método Plug-and-Play, estabelecendo uma nova mudança de paradigma na descoberta científica automatizada altamente eficiente, abrindo caminho para pesquisas impulsionadas por IA mais robustas e aceleradas. O código está disponível publicamente em nosso {GitHub}(https://github.com/amair-lab/PiFlow).
English
Large Language Model (LLM)-based multi-agent systems (MAS) demonstrate
remarkable potential for scientific discovery. Existing approaches, however,
often automate scientific discovery using predefined workflows that lack
rationality constraints. This often leads to aimless hypothesizing and a
failure to consistently link hypotheses with evidence, thereby hindering
systematic uncertainty reduction. Overcoming these limitations fundamentally
requires systematic uncertainty reduction. We introduce PiFlow, an
information-theoretical framework, treating automated scientific discovery as a
structured uncertainty reduction problem guided by principles (e.g., scientific
laws). In evaluations across three distinct scientific domains -- discovering
nanomaterial structures, bio-molecules, and superconductor candidates with
targeted properties -- our method significantly improves discovery efficiency,
reflected by a 73.55\% increase in the Area Under the Curve (AUC) of property
values versus exploration steps, and enhances solution quality by 94.06\%
compared to a vanilla agent system. Overall, PiFlow serves as a
Plug-and-Play method, establishing a novel paradigm shift in highly efficient
automated scientific discovery, paving the way for more robust and accelerated
AI-driven research. Code is publicly available at our
https://github.com/amair-lab/PiFlow{GitHub}.