M^4olGen: Multi-Agenten-, Multi-Stufen-Molekülgenerierung unter präzisen Multieigenschafts-Bedingungen
M^4olGen: Multi-Agent, Multi-Stage Molecular Generation under Precise Multi-Property Constraints
January 15, 2026
papers.authors: Yizhan Li, Florence Cloutier, Sifan Wu, Ali Parviz, Boris Knyazev, Yan Zhang, Glen Berseth, Bang Liu
cs.AI
papers.abstract
Die Erzeugung von Molekülen, die präzise numerische Einschränkungen über mehrere physikochemische Eigenschaften erfüllen, ist von entscheidender Bedeutung und gleichzeitig herausfordernd. Obwohl große Sprachmodelle (LLMs) ausdrucksstark sind, haben sie Schwierigkeiten mit präziser multiobjektiver Steuerung und numerischem Schlussfolgern ohne externe Struktur und Rückmeldung. Wir stellen M olGen vor, ein fragmentbasiertes, retrieval-erweitertes, zweistufiges Framework zur Molekülgenerierung unter Mehrfacheigenschafts-Bedingungen. Stufe I: Prototyp-Generierung: Ein Multi-Agenten-Reasoner führt retrieval-verankerte, fragmentbasierte Editierungen durch, um einen Kandidaten in der Nähe des zulässigen Bereichs zu erzeugen. Stufe II: RL-basierte Feinoptimierung: Ein fragmentbasierter Optimierer, der mit Group Relative Policy Optimization (GRPO) trainiert wurde, wendet Ein- oder Mehrschritt-Verfeinerungen an, um die Eigenschaftsfehler explizit in Richtung unseres Ziels zu minimieren und dabei die Editierkomplexität und die Abweichung vom Prototyp zu regulieren. Ein großer, automatisch kuratierter Datensatz mit Reasoning-Ketten von Fragmenteditierungen und gemessenen Eigenschaftsdifferenzen bildet die Grundlage für beide Stufen und ermöglicht deterministische, reproduzierbare Überwachung und kontrollierbares Mehrschritt-Reasoning. Im Gegensatz zu früheren Arbeiten kann unser Framework Moleküle besser durch die Nutzung von Fragmenten erschließen und unterstützt eine kontrollierbare Verfeinerung hin zu numerischen Zielwerten. Experimente zur Generierung unter zwei Sätzen von Eigenschaftsbedingungen (QED, LogP, Molekulargewicht und HOMO, LUMO) zeigen konsistente Verbesserungen bei der Validität und der präzisen Erfüllung von Mehrfacheigenschaftszielen und übertreffen dabei leistungsstarke LLMs und graphenbasierte Algorithmen.
English
Generating molecules that satisfy precise numeric constraints over multiple physicochemical properties is critical and challenging. Although large language models (LLMs) are expressive, they struggle with precise multi-objective control and numeric reasoning without external structure and feedback. We introduce M olGen, a fragment-level, retrieval-augmented, two-stage framework for molecule generation under multi-property constraints. Stage I : Prototype generation: a multi-agent reasoner performs retrieval-anchored, fragment-level edits to produce a candidate near the feasible region. Stage II : RL-based fine-grained optimization: a fragment-level optimizer trained with Group Relative Policy Optimization (GRPO) applies one- or multi-hop refinements to explicitly minimize the property errors toward our target while regulating edit complexity and deviation from the prototype. A large, automatically curated dataset with reasoning chains of fragment edits and measured property deltas underpins both stages, enabling deterministic, reproducible supervision and controllable multi-hop reasoning. Unlike prior work, our framework better reasons about molecules by leveraging fragments and supports controllable refinement toward numeric targets. Experiments on generation under two sets of property constraints (QED, LogP, Molecular Weight and HOMO, LUMO) show consistent gains in validity and precise satisfaction of multi-property targets, outperforming strong LLMs and graph-based algorithms.