PiFlow: Descoberta Científica Baseada em Princípios com Colaboração Multiagente

Resumo

Sistemas multiagentes (MAS) baseados em Large Language Models (LLMs) demonstram um potencial notável para a descoberta científica. No entanto, as abordagens existentes frequentemente automatizam a descoberta científica utilizando fluxos de trabalho predefinidos que carecem de restrições de racionalidade. Isso frequentemente leva a uma formulação de hipóteses sem direção e a uma falha em vincular consistentemente hipóteses com evidências, prejudicando assim a redução sistemática de incertezas. Superar essas limitações requer fundamentalmente uma redução sistemática de incertezas. Introduzimos o PiFlow, um framework baseado na teoria da informação, que trata a descoberta científica automatizada como um problema estruturado de redução de incertezas guiado por princípios (por exemplo, leis científicas). Em avaliações realizadas em três domínios científicos distintos -- descoberta de estruturas de nanomateriais, biomoléculas e candidatos a supercondutores com propriedades específicas -- nosso método melhora significativamente a eficiência da descoberta, refletida por um aumento de 73,55\% na Área Sob a Curva (AUC) dos valores das propriedades em relação às etapas de exploração, e aprimora a qualidade das soluções em 94,06\% em comparação com um sistema de agentes convencional. No geral, o PiFlow serve como um método Plug-and-Play, estabelecendo uma nova mudança de paradigma na descoberta científica automatizada altamente eficiente, abrindo caminho para pesquisas impulsionadas por IA mais robustas e aceleradas. O código está disponível publicamente em nosso {GitHub}(https://github.com/amair-lab/PiFlow).

English

Large Language Model (LLM)-based multi-agent systems (MAS) demonstrate remarkable potential for scientific discovery. Existing approaches, however, often automate scientific discovery using predefined workflows that lack rationality constraints. This often leads to aimless hypothesizing and a failure to consistently link hypotheses with evidence, thereby hindering systematic uncertainty reduction. Overcoming these limitations fundamentally requires systematic uncertainty reduction. We introduce PiFlow, an information-theoretical framework, treating automated scientific discovery as a structured uncertainty reduction problem guided by principles (e.g., scientific laws). In evaluations across three distinct scientific domains -- discovering nanomaterial structures, bio-molecules, and superconductor candidates with targeted properties -- our method significantly improves discovery efficiency, reflected by a 73.55\% increase in the Area Under the Curve (AUC) of property values versus exploration steps, and enhances solution quality by 94.06\% compared to a vanilla agent system. Overall, PiFlow serves as a Plug-and-Play method, establishing a novel paradigm shift in highly efficient automated scientific discovery, paving the way for more robust and accelerated AI-driven research. Code is publicly available at our https://github.com/amair-lab/PiFlow{GitHub}.

PiFlow: Descoberta Científica Baseada em Princípios com Colaboração Multiagente

PiFlow: Principle-aware Scientific Discovery with Multi-Agent Collaboration

Resumo

Support