M^4olGen: Generazione Molecolare Multi-Agente e Multi-Stadio con Vincoli Multi-Proprietà Precisi
M^4olGen: Multi-Agent, Multi-Stage Molecular Generation under Precise Multi-Property Constraints
January 15, 2026
Autori: Yizhan Li, Florence Cloutier, Sifan Wu, Ali Parviz, Boris Knyazev, Yan Zhang, Glen Berseth, Bang Liu
cs.AI
Abstract
La generazione di molecole che soddisfino vincoli numerici precisi su molteplici proprietà fisico-chimiche è un compito cruciale e impegnativo. Sebbene i grandi modelli linguistici (LLM) siano espressivi, faticano a ottenere un controllo multi-obiettivo preciso e un ragionamento numerico senza strutture esterne e feedback. Introduciamo M olGen, un framework a due stadi, aumentato tramite retrieval e operante a livello di frammenti, per la generazione di molecole sotto vincoli multi-proprietà. Stadio I: Generazione del prototipo: un sistema di ragionamento multi-agente esegue modifiche a livello di frammenti ancorate al retrieval per produrre un candidato vicino alla regione ammissibile. Stadio II: Ottimizzazione fine basata su RL: un ottimizzatore a livello di frammenti, addestrato con Group Relative Policy Optimization (GRPO), applica raffinamenti a uno o più hop per minimizzare esplicitamente gli errori sulle proprietà rispetto al nostro obiettivo, regolando al contempo la complessità delle modifiche e la deviazione dal prototipo. Un ampio dataset, curato automaticamente e contenente catene di ragionamento sulle modifiche ai frammenti e i delta delle proprietà misurate, supporta entrambi gli stadi, consentendo una supervisione deterministica e riproducibile e un ragionamento multi-hop controllabile. A differenza dei lavori precedenti, il nostro framework ragiona meglio sulle molecole sfruttando i frammenti e supporta una raffinazione controllata verso obiettivi numerici. Esperimenti sulla generazione con due insiemi di vincoli di proprietà (QED, LogP, Peso Molecolare e HOMO, LUMO) mostrano miglioramenti consistenti in termini di validità e soddisfacimento preciso degli obiettivi multi-proprietà, superando i potenti LLM e gli algoritmi basati su grafi.
English
Generating molecules that satisfy precise numeric constraints over multiple physicochemical properties is critical and challenging. Although large language models (LLMs) are expressive, they struggle with precise multi-objective control and numeric reasoning without external structure and feedback. We introduce M olGen, a fragment-level, retrieval-augmented, two-stage framework for molecule generation under multi-property constraints. Stage I : Prototype generation: a multi-agent reasoner performs retrieval-anchored, fragment-level edits to produce a candidate near the feasible region. Stage II : RL-based fine-grained optimization: a fragment-level optimizer trained with Group Relative Policy Optimization (GRPO) applies one- or multi-hop refinements to explicitly minimize the property errors toward our target while regulating edit complexity and deviation from the prototype. A large, automatically curated dataset with reasoning chains of fragment edits and measured property deltas underpins both stages, enabling deterministic, reproducible supervision and controllable multi-hop reasoning. Unlike prior work, our framework better reasons about molecules by leveraging fragments and supports controllable refinement toward numeric targets. Experiments on generation under two sets of property constraints (QED, LogP, Molecular Weight and HOMO, LUMO) show consistent gains in validity and precise satisfaction of multi-property targets, outperforming strong LLMs and graph-based algorithms.