M^4olGen: Multi-Agent, Multi-Stadiaal Molecuulgeneratie onder Precieze Multi-Eigenschap Beperkingen
M^4olGen: Multi-Agent, Multi-Stage Molecular Generation under Precise Multi-Property Constraints
January 15, 2026
Auteurs: Yizhan Li, Florence Cloutier, Sifan Wu, Ali Parviz, Boris Knyazev, Yan Zhang, Glen Berseth, Bang Liu
cs.AI
Samenvatting
Het genereren van moleculen die voldoen aan precieze numerieke beperkingen voor meerdere fysisch-chemische eigenschappen is cruciaal en uitdagend. Hoewel grote taalmodellen (LLM's) expressief zijn, hebben ze moeite met precieze multi-objectieve controle en numeriek redeneren zonder externe structuur en feedback. Wij introduceren M olGen, een fragmentniveau, retrieval-augmented, tweestaps raamwerk voor molecuulgeneratie onder multi-eigenschap beperkingen. Fase I: Prototype-generatie: een multi-agent reasoner voert retrieval-verankerde, fragmentniveau bewerkingen uit om een kandidaat nabij het haalbare gebied te produceren. Fase II: RL-gebaseerde fijnmazige optimalisatie: een fragmentniveau optimizer getraind met Group Relative Policy Optimization (GRPO) past één- of multi-hop verfijningen toe om de eigenschapfouten expliciet te minimaliseren richting ons doel, terwijl de bewerkingscomplexiteit en afwijking van het prototype worden gereguleerd. Een grote, automatisch samengestelde dataset met redeneerketens van fragmentbewerkingen en gemeten eigenschapsdelta's ondersteunt beide fasen, waardoor deterministische, reproduceerbare supervisie en controleerbaar multi-hop redeneren mogelijk wordt. In tegenstelling tot eerder werk, redeneert ons raamwerk beter over moleculen door fragmenten te benutten en ondersteunt het controleerbare verfijning richting numerieke doelen. Experimenten met generatie onder twee sets eigenschapsbeperkingen (QED, LogP, Moleculair Gewicht en HOMO, LUMO) tonen consistente winsten in geldigheid en precieze voldoening aan multi-eigenschap doelen, waarbij sterke LLM's en op grafen gebaseerde algoritmen worden overtroffen.
English
Generating molecules that satisfy precise numeric constraints over multiple physicochemical properties is critical and challenging. Although large language models (LLMs) are expressive, they struggle with precise multi-objective control and numeric reasoning without external structure and feedback. We introduce M olGen, a fragment-level, retrieval-augmented, two-stage framework for molecule generation under multi-property constraints. Stage I : Prototype generation: a multi-agent reasoner performs retrieval-anchored, fragment-level edits to produce a candidate near the feasible region. Stage II : RL-based fine-grained optimization: a fragment-level optimizer trained with Group Relative Policy Optimization (GRPO) applies one- or multi-hop refinements to explicitly minimize the property errors toward our target while regulating edit complexity and deviation from the prototype. A large, automatically curated dataset with reasoning chains of fragment edits and measured property deltas underpins both stages, enabling deterministic, reproducible supervision and controllable multi-hop reasoning. Unlike prior work, our framework better reasons about molecules by leveraging fragments and supports controllable refinement toward numeric targets. Experiments on generation under two sets of property constraints (QED, LogP, Molecular Weight and HOMO, LUMO) show consistent gains in validity and precise satisfaction of multi-property targets, outperforming strong LLMs and graph-based algorithms.