Mozi: Autonomia Governata per Agenti LLM nella Scoperta di Farmaci

Abstract

Gli agenti basati su grandi modelli linguistici (LLM) potenziati da strumenti promettono di unificare il ragionamento scientifico con il calcolo computazionale, ma il loro dispiegamento in domini ad alto rischio come la scoperta di farmaci è ostacolato da due barriere critiche: una governance non vincolata dell'uso degli strumenti e una scarsa affidabilità negli orizzonti temporali lunghi. Nelle pipeline farmaceutiche ad alta dipendenza, gli agenti autonomi spesso deviano verso traiettorie irreproducibili, dove allucinazioni nelle fasi iniziali si moltiplicano generando fallimenti a valle. Per superare questo problema, presentiamo Mozi, un'architettura a doppio strato che colma la flessibilità dell'IA generativa con il rigore deterministico della biologia computazionale. Lo Strato A (Piano di Controllo) stabilisce una gerarchia governata di supervisore-operatore che applica un isolamento degli strumenti basato sui ruoli, limita l'esecuzione a spazi di azione vincolati e guida un ripianificazione basata sulla riflessione. Lo Strato B (Piano del Flusso di Lavoro) opera le fasi canoniche della scoperta di farmaci – dall'Identificazione del Target all'Ottimizzazione dei Lead – come grafi di abilità componibili e con stato. Questo strato integra contratti di dati rigorosi e checkpoint strategici con umano nel ciclo (HITL) per salvaguardare la validità scientifica ai confini decisionali ad alta incertezza. Operando sul principio di progettazione "ragionamento in forma libera per compiti sicuri, esecuzione strutturata per pipeline a lungo termine", Mozi fornisce meccanismi di robustezza integrati e un'audibilità a livello di traccia per mitigare completamente l'accumulo di errori. Valutiamo Mozi su PharmaBench, un benchmark curato per agenti biomedici, dimostrando un'accuratezza di orchestrazione superiore rispetto ai baseline esistenti. Inoltre, attraverso studi di caso terapeutici end-to-end, dimostriamo la capacità di Mozi di navigare in spazi chimici massivi, applicare filtri di tossicità stringenti e generare candidati *in silico* altamente competitivi, trasformando efficacemente l'LLM da un fragile conversazionale in un co-scienziato affidabile e governato.

English

Tool-augmented large language model (LLM) agents promise to unify scientific reasoning with computation, yet their deployment in high-stakes domains like drug discovery is bottlenecked by two critical barriers: unconstrained tool-use governance and poor long-horizon reliability. In dependency-heavy pharmaceutical pipelines, autonomous agents often drift into irreproducible trajectories, where early-stage hallucinations multiplicatively compound into downstream failures. To overcome this, we present Mozi, a dual-layer architecture that bridges the flexibility of generative AI with the deterministic rigor of computational biology. Layer A (Control Plane) establishes a governed supervisor--worker hierarchy that enforces role-based tool isolation, limits execution to constrained action spaces, and drives reflection-based replanning. Layer B (Workflow Plane) operationalizes canonical drug discovery stages -- from Target Identification to Lead Optimization -- as stateful, composable skill graphs. This layer integrates strict data contracts and strategic human-in-the-loop (HITL) checkpoints to safeguard scientific validity at high-uncertainty decision boundaries. Operating on the design principle of ``free-form reasoning for safe tasks, structured execution for long-horizon pipelines,'' Mozi provides built-in robustness mechanisms and trace-level audibility to completely mitigate error accumulation. We evaluate Mozi on PharmaBench, a curated benchmark for biomedical agents, demonstrating superior orchestration accuracy over existing baselines. Furthermore, through end-to-end therapeutic case studies, we demonstrate Mozi's ability to navigate massive chemical spaces, enforce stringent toxicity filters, and generate highly competitive in silico candidates, effectively transforming the LLM from a fragile conversationalist into a reliable, governed co-scientist.

Mozi: Autonomia Governata per Agenti LLM nella Scoperta di Farmaci

Mozi: Governed Autonomy for Drug Discovery LLM Agents

Abstract

Support