ChatPaper.aiChatPaper

Mozi: Autonomía Gobernada para Agentes LLM en el Descubrimiento de Fármacos

Mozi: Governed Autonomy for Drug Discovery LLM Agents

March 4, 2026
Autores: He Cao, Siyu Liu, Fan Zhang, Zijing Liu, Hao Li, Bin Feng, Shengyuan Bai, Leqing Chen, Kai Xie, Yu Li
cs.AI

Resumen

Los agentes de modelos de lenguaje grandes (LLM) aumentados con herramientas prometen unificar el razonamiento científico con la computación, sin embargo, su despliegue en dominios de alto riesgo como el descubrimiento de fármacos se ve limitado por dos barreras críticas: una gobernanza no restringida del uso de herramientas y una baja fiabilidad en horizontes temporales largos. En las pipelines farmacéuticas, con gran dependencia secuencial, los agentes autónomos a menudo derivan hacia trayectorias irreproducibles, donde las alucinaciones en etapas tempranas se multiplican en fallos en fases posteriores. Para superar esto, presentamos Mozi, una arquitectura de doble capa que tiende un puente entre la flexibilidad de la IA generativa y el rigor determinista de la biología computacional. La Capa A (Plano de Control) establece una jerarquía gobernada de supervisor-trabajador que impone un aislamiento de herramientas basado en roles, limita la ejecución a espacios de acción restringidos e impulsa una replanificación basada en la reflexión. La Capa B (Plano de Flujo de Trabajo) operacionaliza las etapas canónicas del descubrimiento de fármacos —desde la Identificación de Dianas hasta la Optimización de Candidatos— como grafos de habilidades componibles y con estado. Esta capa integra contratos de datos estrictos y puntos de control estratégicos con intervención humana (HITL) para salvaguardar la validez científica en los límites de decisión de alta incertidumbre. Operando bajo el principio de diseño de "razonamiento de forma libre para tareas seguras, ejecución estructurada para pipelines de largo horizonte", Mozi proporciona mecanismos de robustez integrados y una auditabilidad a nivel de traza para mitigar completamente la acumulación de errores. Evaluamos a Mozi en PharmaBench, un benchmark curado para agentes biomédicos, demostrando una precisión de orquestación superior a los baselines existentes. Además, mediante estudios de caso terapéuticos de extremo a extremo, demostramos la capacidad de Mozi para navegar espacios químicos masivos, aplicar filtros de toxicidad estrictos y generar candidatos *in silico* altamente competitivos, transformando efectivamente al LLM de un conversador frágil en un co-científico fiable y gobernado.
English
Tool-augmented large language model (LLM) agents promise to unify scientific reasoning with computation, yet their deployment in high-stakes domains like drug discovery is bottlenecked by two critical barriers: unconstrained tool-use governance and poor long-horizon reliability. In dependency-heavy pharmaceutical pipelines, autonomous agents often drift into irreproducible trajectories, where early-stage hallucinations multiplicatively compound into downstream failures. To overcome this, we present Mozi, a dual-layer architecture that bridges the flexibility of generative AI with the deterministic rigor of computational biology. Layer A (Control Plane) establishes a governed supervisor--worker hierarchy that enforces role-based tool isolation, limits execution to constrained action spaces, and drives reflection-based replanning. Layer B (Workflow Plane) operationalizes canonical drug discovery stages -- from Target Identification to Lead Optimization -- as stateful, composable skill graphs. This layer integrates strict data contracts and strategic human-in-the-loop (HITL) checkpoints to safeguard scientific validity at high-uncertainty decision boundaries. Operating on the design principle of ``free-form reasoning for safe tasks, structured execution for long-horizon pipelines,'' Mozi provides built-in robustness mechanisms and trace-level audibility to completely mitigate error accumulation. We evaluate Mozi on PharmaBench, a curated benchmark for biomedical agents, demonstrating superior orchestration accuracy over existing baselines. Furthermore, through end-to-end therapeutic case studies, we demonstrate Mozi's ability to navigate massive chemical spaces, enforce stringent toxicity filters, and generate highly competitive in silico candidates, effectively transforming the LLM from a fragile conversationalist into a reliable, governed co-scientist.
PDF22March 9, 2026