ChatPaper.aiChatPaper

M^4olGen: Generación Molecular Multiagente y Multietapa bajo Restricciones Multipropiedad Precisas

M^4olGen: Multi-Agent, Multi-Stage Molecular Generation under Precise Multi-Property Constraints

January 15, 2026
Autores: Yizhan Li, Florence Cloutier, Sifan Wu, Ali Parviz, Boris Knyazev, Yan Zhang, Glen Berseth, Bang Liu
cs.AI

Resumen

La generación de moléculas que satisfacen restricciones numéricas precisas sobre múltiples propiedades fisicoquímicas es crucial y desafiante. Aunque los modelos de lenguaje grandes (LLM) son expresivos, luchan con el control multiobjetivo preciso y el razonamiento numérico sin estructura y retroalimentación externas. Presentamos M olGen, un marco de dos etapas, aumentado por recuperación de información y a nivel de fragmentos, para la generación de moléculas bajo restricciones de múltiples propiedades. Etapa I: Generación de prototipos: un razonador multiagente realiza ediciones a nivel de fragmentos ancladas en recuperación para producir un candidato cercano a la región factible. Etapa II: Optimización de grano fino basada en RL: un optimizador a nivel de fragmentos entrenado con Optimización de Políticas Relativas Grupales (GRPO) aplica refinamientos de uno o múltiples saltos para minimizar explícitamente los errores de propiedad hacia nuestro objetivo, regulando simultáneamente la complejidad de la edición y la desviación del prototipo. Un conjunto de datos grande, curado automáticamente, con cadenas de razonamiento de ediciones de fragmentos y deltas de propiedades medidas sustenta ambas etapas, permitiendo una supervisión determinista y reproducible y un razonamiento controlable de múltiples saltos. A diferencia de trabajos anteriores, nuestro marco razona mejor sobre las moléculas al aprovechar los fragmentos y admite un refinamiento controlado hacia objetivos numéricos. Los experimentos de generación bajo dos conjuntos de restricciones de propiedades (QED, LogP, Peso Molecular y HOMO, LUMO) muestran ganancias consistentes en validez y satisfacción precisa de objetivos multi-propiedad, superando a LLMs robustos y algoritmos basados en grafos.
English
Generating molecules that satisfy precise numeric constraints over multiple physicochemical properties is critical and challenging. Although large language models (LLMs) are expressive, they struggle with precise multi-objective control and numeric reasoning without external structure and feedback. We introduce M olGen, a fragment-level, retrieval-augmented, two-stage framework for molecule generation under multi-property constraints. Stage I : Prototype generation: a multi-agent reasoner performs retrieval-anchored, fragment-level edits to produce a candidate near the feasible region. Stage II : RL-based fine-grained optimization: a fragment-level optimizer trained with Group Relative Policy Optimization (GRPO) applies one- or multi-hop refinements to explicitly minimize the property errors toward our target while regulating edit complexity and deviation from the prototype. A large, automatically curated dataset with reasoning chains of fragment edits and measured property deltas underpins both stages, enabling deterministic, reproducible supervision and controllable multi-hop reasoning. Unlike prior work, our framework better reasons about molecules by leveraging fragments and supports controllable refinement toward numeric targets. Experiments on generation under two sets of property constraints (QED, LogP, Molecular Weight and HOMO, LUMO) show consistent gains in validity and precise satisfaction of multi-property targets, outperforming strong LLMs and graph-based algorithms.
PDF91January 17, 2026