PiFlow: Принципно-ориентированное научное открытие с использованием мультиагентного взаимодействия
PiFlow: Principle-aware Scientific Discovery with Multi-Agent Collaboration
May 21, 2025
Авторы: Yingming Pu, Tao Lin, Hongyu Chen
cs.AI
Аннотация
Многоагентные системы (MAS), основанные на больших языковых моделях (LLM), демонстрируют значительный потенциал для научных открытий. Однако существующие подходы часто автоматизируют научные исследования с использованием заранее заданных рабочих процессов, которые не учитывают ограничения рациональности. Это зачастую приводит к бесцельному выдвижению гипотез и неспособности последовательно связывать гипотезы с доказательствами, что препятствует систематическому снижению неопределенности. Преодоление этих ограничений требует фундаментального подхода к систематическому снижению неопределенности. Мы представляем PiFlow, информационно-теоретическую структуру, которая рассматривает автоматизированное научное открытие как структурированную задачу снижения неопределенности, руководствуясь принципами (например, научными законами). В оценках, проведенных в трех различных научных областях — открытие структур наноматериалов, биомолекул и кандидатов в сверхпроводники с целевыми свойствами — наш метод значительно повышает эффективность открытий, что отражается в увеличении площади под кривой (AUC) значений свойств относительно шагов исследования на 73,55%, а также улучшает качество решений на 94,06% по сравнению с базовой агентной системой. В целом, PiFlow служит методом Plug-and-Play, устанавливая новый парадигмальный сдвиг в высокоэффективном автоматизированном научном открытии, прокладывая путь для более надежных и ускоренных исследований на основе ИИ. Код доступен публично на нашем {GitHub}(https://github.com/amair-lab/PiFlow).
English
Large Language Model (LLM)-based multi-agent systems (MAS) demonstrate
remarkable potential for scientific discovery. Existing approaches, however,
often automate scientific discovery using predefined workflows that lack
rationality constraints. This often leads to aimless hypothesizing and a
failure to consistently link hypotheses with evidence, thereby hindering
systematic uncertainty reduction. Overcoming these limitations fundamentally
requires systematic uncertainty reduction. We introduce PiFlow, an
information-theoretical framework, treating automated scientific discovery as a
structured uncertainty reduction problem guided by principles (e.g., scientific
laws). In evaluations across three distinct scientific domains -- discovering
nanomaterial structures, bio-molecules, and superconductor candidates with
targeted properties -- our method significantly improves discovery efficiency,
reflected by a 73.55\% increase in the Area Under the Curve (AUC) of property
values versus exploration steps, and enhances solution quality by 94.06\%
compared to a vanilla agent system. Overall, PiFlow serves as a
Plug-and-Play method, establishing a novel paradigm shift in highly efficient
automated scientific discovery, paving the way for more robust and accelerated
AI-driven research. Code is publicly available at our
https://github.com/amair-lab/PiFlow{GitHub}.Summary
AI-Generated Summary