ChatPaper.aiChatPaper

M^4olGen: 다중 특성 제약 조건 하의 다중 에이전트, 다중 단계 분자 생성

M^4olGen: Multi-Agent, Multi-Stage Molecular Generation under Precise Multi-Property Constraints

January 15, 2026
저자: Yizhan Li, Florence Cloutier, Sifan Wu, Ali Parviz, Boris Knyazev, Yan Zhang, Glen Berseth, Bang Liu
cs.AI

초록

정확한 수치적 제약 조건을 만족하는 다중 물리화학적 특성을 지닌 분자를 생성하는 것은 중요하면서도 어려운 과제입니다. 대규모 언어 모델(LLM)은 표현력이 뛰어나지만, 외부 구조와 피드백 없이는 정밀한 다중 목표 제어 및 수치 추론에 어려움을 겪습니다. 본 연구에서는 다중 특성 제약 조건 하에서 분자를 생성하기 위한 프래그먼트 수준의 검색 증강 두 단계 프레임워크인 M olGen을 소개합니다. 1단계: 프로토타입 생성 - 다중 에이전트 추론기가 검색에 기반한 프래그먼트 수준의 편집을 수행하여 실현 가능 영역 근처의 후보 분자를 생성합니다. 2단계: RL 기반 세밀 최적화 - Group Relative Policy Optimization(GRPO)으로 훈련된 프래그먼트 수준 최적화기가 1홉 또는 다중 홉 정제를 적용하여 목표 특성 오차를 명시적으로 최소화하면서 편집 복잡성과 프로토타입 이탈을 조절합니다. 프래그먼트 편집의 추론 체인과 측정된 특성 변화량으로 구성된 대규모 자동 수집 데이터셋이 두 단계를 지원하여 결정적이고 재현 가능한 지도 학습 및 제어 가능한 다중 홉 추론을 가능하게 합니다. 기존 연구와 달리, 본 프레임워크는 프래그먼트를 활용하여 분자를 더 효과적으로 추론하며 수치적 목표를 향한 제어 가능한 정제를 지원합니다. 두 가지 특성 제약 조건 집합(QED, LogP, 분자량 및 HOMO, LUMO) 하에서의 생성 실험 결과, 타당성과 다중 특성 목표의 정확한 만족도 측면에서 일관된 성능 향상을 보여 강력한 LLM 및 그래프 기반 알고리즘을 능가함을 확인했습니다.
English
Generating molecules that satisfy precise numeric constraints over multiple physicochemical properties is critical and challenging. Although large language models (LLMs) are expressive, they struggle with precise multi-objective control and numeric reasoning without external structure and feedback. We introduce M olGen, a fragment-level, retrieval-augmented, two-stage framework for molecule generation under multi-property constraints. Stage I : Prototype generation: a multi-agent reasoner performs retrieval-anchored, fragment-level edits to produce a candidate near the feasible region. Stage II : RL-based fine-grained optimization: a fragment-level optimizer trained with Group Relative Policy Optimization (GRPO) applies one- or multi-hop refinements to explicitly minimize the property errors toward our target while regulating edit complexity and deviation from the prototype. A large, automatically curated dataset with reasoning chains of fragment edits and measured property deltas underpins both stages, enabling deterministic, reproducible supervision and controllable multi-hop reasoning. Unlike prior work, our framework better reasons about molecules by leveraging fragments and supports controllable refinement toward numeric targets. Experiments on generation under two sets of property constraints (QED, LogP, Molecular Weight and HOMO, LUMO) show consistent gains in validity and precise satisfaction of multi-property targets, outperforming strong LLMs and graph-based algorithms.
PDF91January 17, 2026