PiFlow: 다중 에이전트 협업을 통한 원리 기반 과학적 발견
PiFlow: Principle-aware Scientific Discovery with Multi-Agent Collaboration
May 21, 2025
저자: Yingming Pu, Tao Lin, Hongyu Chen
cs.AI
초록
대규모 언어 모델(LLM) 기반 다중 에이전트 시스템(MAS)은 과학적 발견에 있어서 놀라운 잠재력을 보여줍니다. 그러나 기존의 접근 방식들은 종종 합리성 제약이 없는 사전 정의된 워크플로우를 사용하여 과학적 발견을 자동화하는데, 이는 목적 없는 가설 설정과 가설과 증거를 일관되게 연결하지 못하는 문제를 초래하며, 체계적인 불확실성 감소를 방해합니다. 이러한 한계를 극복하기 위해서는 근본적으로 체계적인 불확실성 감소가 필요합니다. 우리는 PiFlow라는 정보 이론적 프레임워크를 소개하며, 자동화된 과학적 발견을 과학적 법칙과 같은 원칙에 의해 안내되는 구조화된 불확실성 감소 문제로 취급합니다. 나노물질 구조, 생체 분자, 그리고 목표 특성을 가진 초전도체 후보물질 발견이라는 세 가지 과학적 영역에서의 평가에서, 우리의 방법은 탐색 단계 대비 특성 값의 곡선 아래 면적(AUC)에서 73.55%의 증가를 보여주었고, 기본 에이전트 시스템 대비 솔루션 품질을 94.06% 향상시켰습니다. 전반적으로, PiFlow는 플러그 앤 플레이 방식으로 작동하며, 고효율 자동화 과학적 발견에서 새로운 패러다임 전환을 이끌어내어, 더욱 견고하고 가속화된 AI 기반 연구의 길을 열어줍니다. 코드는 https://github.com/amair-lab/PiFlow{GitHub}에서 공개되어 있습니다.
English
Large Language Model (LLM)-based multi-agent systems (MAS) demonstrate
remarkable potential for scientific discovery. Existing approaches, however,
often automate scientific discovery using predefined workflows that lack
rationality constraints. This often leads to aimless hypothesizing and a
failure to consistently link hypotheses with evidence, thereby hindering
systematic uncertainty reduction. Overcoming these limitations fundamentally
requires systematic uncertainty reduction. We introduce PiFlow, an
information-theoretical framework, treating automated scientific discovery as a
structured uncertainty reduction problem guided by principles (e.g., scientific
laws). In evaluations across three distinct scientific domains -- discovering
nanomaterial structures, bio-molecules, and superconductor candidates with
targeted properties -- our method significantly improves discovery efficiency,
reflected by a 73.55\% increase in the Area Under the Curve (AUC) of property
values versus exploration steps, and enhances solution quality by 94.06\%
compared to a vanilla agent system. Overall, PiFlow serves as a
Plug-and-Play method, establishing a novel paradigm shift in highly efficient
automated scientific discovery, paving the way for more robust and accelerated
AI-driven research. Code is publicly available at our
https://github.com/amair-lab/PiFlow{GitHub}.Summary
AI-Generated Summary