ChatPaper.aiChatPaper

Mozi: Gesteuerte Autonomie für arzneimittelentdeckende LLM-Agenten

Mozi: Governed Autonomy for Drug Discovery LLM Agents

March 4, 2026
Autoren: He Cao, Siyu Liu, Fan Zhang, Zijing Liu, Hao Li, Bin Feng, Shengyuan Bai, Leqing Chen, Kai Xie, Yu Li
cs.AI

Zusammenfassung

Tool-augmented Large Language Model (LLM)-Agenten versprechen eine Vereinigung von wissenschaftlichem Denken und Berechnung, doch ihr Einsatz in hochriskanten Bereichen wie der Wirkstoffentwicklung wird durch zwei kritische Hindernisse eingeschränkt: unkontrollierte Werkzeugnutzung und mangelnde Zuverlässigkeit bei langfristigen Aufgaben. In stark vernetzten pharmazeutischen Prozessketten neigen autonome Agenten oft zu nicht reproduzierbaren Abläufen, bei denen sich Halluzinationen aus frühen Phasen multiplikativ zu Fehlschlägen in nachgelagerten Stufen aufschaukeln. Um dies zu überwinden, stellen wir Mozi vor – eine Architektur mit zwei Ebenen, die die Flexibilität generativer KI mit der deterministischen Strenge der computerbasierten Biologie verbindet. Ebene A (Kontroll-Ebene) etabliert eine kontrollierte Supervisor-Worker-Hierarchie, die rollenbasierte Werkzeugisolation durchsetzt, die Ausführung auf eingeschränkte Aktionsräume begrenzt und reflektionsbasiertes Neuplanung antreibt. Ebene B (Ablauf-Ebene) operationalisiert kanonische Phasen der Wirkstoffentwicklung – von der Target-Identifikation bis zur Lead-Optimierung – als zustandsbehaftete, zusammensetzbare Fähigkeitsgraphen. Diese Ebene integriert strikte Datenverträge und strategische Human-in-the-Loop (HITL)-Kontrollpunkte, um die wissenschaftliche Validität an Entscheidungsgrenzen mit hoher Unsicherheit zu gewährleisten. Basierend auf dem Designprinzip „Freiform-Denken für sichere Aufgaben, strukturierte Ausführung für langfristige Prozessketten“ bietet Mozi eingebaute Robustheitsmechanismen und Rückverfolgbarkeit auf Verfolgungsebene, um Fehlerakkumulation vollständig zu vermeiden. Wir evaluieren Mozi anhand von PharmaBench, einem kuratierten Benchmark für biomedizinische Agenten, und demonstrieren eine überlegene Orchestrierungsgenauigkeit gegenüber existierenden Baseline-Verfahren. Darüber hinaus zeigen wir in end-to-end therapeutischen Fallstudien Mozi's Fähigkeit, massive chemische Räume zu navigieren, strenge Toxizitätsfilter durchzusetzen und hochgradig wettbewerbsfähige *in-silico*-Kandidaten zu generieren. Damit verwandelt Mozi das LLM effektiv von einem anfälligen Gesprächspartner in einen zuverlässigen, kontrollierten Forschungspartner.
English
Tool-augmented large language model (LLM) agents promise to unify scientific reasoning with computation, yet their deployment in high-stakes domains like drug discovery is bottlenecked by two critical barriers: unconstrained tool-use governance and poor long-horizon reliability. In dependency-heavy pharmaceutical pipelines, autonomous agents often drift into irreproducible trajectories, where early-stage hallucinations multiplicatively compound into downstream failures. To overcome this, we present Mozi, a dual-layer architecture that bridges the flexibility of generative AI with the deterministic rigor of computational biology. Layer A (Control Plane) establishes a governed supervisor--worker hierarchy that enforces role-based tool isolation, limits execution to constrained action spaces, and drives reflection-based replanning. Layer B (Workflow Plane) operationalizes canonical drug discovery stages -- from Target Identification to Lead Optimization -- as stateful, composable skill graphs. This layer integrates strict data contracts and strategic human-in-the-loop (HITL) checkpoints to safeguard scientific validity at high-uncertainty decision boundaries. Operating on the design principle of ``free-form reasoning for safe tasks, structured execution for long-horizon pipelines,'' Mozi provides built-in robustness mechanisms and trace-level audibility to completely mitigate error accumulation. We evaluate Mozi on PharmaBench, a curated benchmark for biomedical agents, demonstrating superior orchestration accuracy over existing baselines. Furthermore, through end-to-end therapeutic case studies, we demonstrate Mozi's ability to navigate massive chemical spaces, enforce stringent toxicity filters, and generate highly competitive in silico candidates, effectively transforming the LLM from a fragile conversationalist into a reliable, governed co-scientist.
PDF22March 9, 2026