MADD: Orchestra per la Scoperta di Farmaci tramite Agenti Multipli
MADD: Multi-Agent Drug Discovery Orchestra
November 11, 2025
Autori: Gleb V. Solovev, Alina B. Zhidkovskaya, Anastasia Orlova, Nina Gubina, Anastasia Vepreva, Rodion Golovinskii, Ilya Tonkii, Ivan Dubrovsky, Ivan Gurev, Dmitry Gilemkhanov, Denis Chistiakov, Timur A. Aliev, Ivan Poddiakov, Galina Zubkova, Ekaterina V. Skorb, Vladimir Vinogradov, Alexander Boukhanovsky, Nikolay Nikitin, Andrei Dmitrenko, Anna Kalyuzhnaya, Andrey Savchenko
cs.AI
Abstract
L'identificazione di hit è una sfida centrale nelle prime fasi della scoperta di farmaci, tradizionalmente caratterizzata da un elevato impiego di risorse sperimentali. I recenti progressi nell'intelligenza artificiale, in particolare nei modelli linguistici di grandi dimensioni (LLM), hanno reso possibili metodi di screening virtuale che riducono i costi e migliorano l'efficienza. Tuttavia, la crescente complessità di questi strumenti ne ha limitato l'accessibilità per i ricercatori di laboratorio. I sistemi multi-agente offrono una soluzione promettente, combinando l'interpretabilità degli LLM con la precisione di modelli e strumenti specializzati. In questo lavoro, presentiamo MADD, un sistema multi-agente che costruisce ed esegue pipeline personalizzate per l'identificazione di hit a partire da query in linguaggio naturale. MADD impiega quattro agenti coordinati per gestire sotto-attività chiave nella generazione e screening *de novo* di composti. Valutiamo MADD in sette casi di scoperta di farmaci e ne dimostriamo le prestazioni superiori rispetto alle soluzioni esistenti basate su LLM. Utilizzando MADD, siamo pionieri nell'applicare un approccio di drug design guidato dall'IA a cinque target biologici e rendiamo pubblicamente disponibili le molecole hit identificate. Infine, introduciamo un nuovo benchmark di coppie query-molecola e punteggi di docking per oltre tre milioni di composti, per contribuire al futuro agentico del drug design.
English
Hit identification is a central challenge in early drug discovery, traditionally requiring substantial experimental resources. Recent advances in artificial intelligence, particularly large language models (LLMs), have enabled virtual screening methods that reduce costs and improve efficiency. However, the growing complexity of these tools has limited their accessibility to wet-lab researchers. Multi-agent systems offer a promising solution by combining the interpretability of LLMs with the precision of specialized models and tools. In this work, we present MADD, a multi-agent system that builds and executes customized hit identification pipelines from natural language queries. MADD employs four coordinated agents to handle key subtasks in de novo compound generation and screening. We evaluate MADD across seven drug discovery cases and demonstrate its superior performance compared to existing LLM-based solutions. Using MADD, we pioneer the application of AI-first drug design to five biological targets and release the identified hit molecules. Finally, we introduce a new benchmark of query-molecule pairs and docking scores for over three million compounds to contribute to the agentic future of drug design.