M^4olGen : Génération Moléculaire Multi-Agent et Multi-Étapes sous Contraintes Multi-Propriétés Précises
M^4olGen: Multi-Agent, Multi-Stage Molecular Generation under Precise Multi-Property Constraints
January 15, 2026
papers.authors: Yizhan Li, Florence Cloutier, Sifan Wu, Ali Parviz, Boris Knyazev, Yan Zhang, Glen Berseth, Bang Liu
cs.AI
papers.abstract
La génération de molécules satisfaisant des contraintes numériques précises sur de multiples propriétés physico-chimiques est un enjeu crucial et difficile. Bien que les grands modèles de langage (LLM) soient expressifs, ils peinent à assurer un contrôle multi-objectif précis et un raisonnement numérique sans structure externe et rétroaction. Nous présentons M olGen, un cadre fragmentaire, augmenté par retrieval, en deux étapes pour la génération de molécules sous contraintes multi-propriétés. Étape I : Génération de prototype : un raisonneur multi-agent effectue des modifications au niveau des fragments, ancrées par retrieval, pour produire un candidat proche de la région réalisable. Étape II : Optimisation fine par RL : un optimiseur au niveau des fragments, entraîné avec l'Optimisation de Politique Relative par Groupe (GRPO), applique des affinements en un ou plusieurs sauts pour minimiser explicitement les erreurs sur les propriétés vers notre cible, tout en régulant la complexité des modifications et l'écart par rapport au prototype. Un vaste ensemble de données, automatiquement constitué, contenant des chaînes de raisonnement sur les modifications de fragments et les deltas de propriétés mesurés, sous-tend les deux étapes, permettant un suivi déterministe, reproductible et un raisonnement contrôlable en plusieurs sauts. Contrairement aux travaux antérieurs, notre cadre raisonne mieux sur les molécules en exploitant les fragments et prend en charge un affinement contrôlable vers des cibles numériques. Les expériences sur la génération sous deux ensembles de contraintes de propriétés (QED, LogP, Poids Moléculaire et HOMO, LUMO) montrent des gains constants en termes de validité et de satisfaction précise des cibles multi-propriétés, surpassant les LLM robustes et les algorithmes basés sur les graphes.
English
Generating molecules that satisfy precise numeric constraints over multiple physicochemical properties is critical and challenging. Although large language models (LLMs) are expressive, they struggle with precise multi-objective control and numeric reasoning without external structure and feedback. We introduce M olGen, a fragment-level, retrieval-augmented, two-stage framework for molecule generation under multi-property constraints. Stage I : Prototype generation: a multi-agent reasoner performs retrieval-anchored, fragment-level edits to produce a candidate near the feasible region. Stage II : RL-based fine-grained optimization: a fragment-level optimizer trained with Group Relative Policy Optimization (GRPO) applies one- or multi-hop refinements to explicitly minimize the property errors toward our target while regulating edit complexity and deviation from the prototype. A large, automatically curated dataset with reasoning chains of fragment edits and measured property deltas underpins both stages, enabling deterministic, reproducible supervision and controllable multi-hop reasoning. Unlike prior work, our framework better reasons about molecules by leveraging fragments and supports controllable refinement toward numeric targets. Experiments on generation under two sets of property constraints (QED, LogP, Molecular Weight and HOMO, LUMO) show consistent gains in validity and precise satisfaction of multi-property targets, outperforming strong LLMs and graph-based algorithms.