MADD: Multi-Agent Orkest voor Geneesmiddelenontdekking
MADD: Multi-Agent Drug Discovery Orchestra
November 11, 2025
Auteurs: Gleb V. Solovev, Alina B. Zhidkovskaya, Anastasia Orlova, Nina Gubina, Anastasia Vepreva, Rodion Golovinskii, Ilya Tonkii, Ivan Dubrovsky, Ivan Gurev, Dmitry Gilemkhanov, Denis Chistiakov, Timur A. Aliev, Ivan Poddiakov, Galina Zubkova, Ekaterina V. Skorb, Vladimir Vinogradov, Alexander Boukhanovsky, Nikolay Nikitin, Andrei Dmitrenko, Anna Kalyuzhnaya, Andrey Savchenko
cs.AI
Samenvatting
Hit-identificatie is een centrale uitdaging in de vroege fase van geneesmiddelenontwikkeling, waarvoor traditioneel aanzienlijke experimentele middelen nodig zijn. Recente vooruitgang in kunstmatige intelligentie, met name grote taalmodelen (LLM's), heeft virtuele screeningsmethoden mogelijk gemaakt die de kosten verlagen en de efficiëntie verbeteren. De toenemende complexiteit van deze tools heeft hun toegankelijkheid voor onderzoekers in het natte lab echter beperkt. Multi-agent systemen bieden een veelbelovende oplossing door de interpreteerbaarheid van LLM's te combineren met de precisie van gespecialiseerde modellen en tools. In dit werk presenteren we MADD, een multi-agent systeem dat gepersonaliseerde pijplijnen voor hit-identificatie bouwt en uitvoert op basis van natuurlijke-taalaanvragen. MADD zet vier gecoördineerde agents in voor de belangrijkste deeltaken in de novo generatie en screening van verbindingen. We evalueren MADD in zeven gevallen van geneesmiddelenontwikkeling en tonen de superieure prestaties aan in vergelijking met bestaande op LLM gebaseerde oplossingen. Met behulp van MADD pionieren we met de toepassing van AI-first geneesmiddelontwerp voor vijf biologische targets en maken we de geïdentificeerde hitmoleculen openbaar. Ten slotte introduceren we een nieuwe benchmark van vraag-molecuul paren en dockingscores voor meer dan drie miljoen verbindingen om bij te dragen aan de agent-gebaseerde toekomst van geneesmiddelontwerp.
English
Hit identification is a central challenge in early drug discovery, traditionally requiring substantial experimental resources. Recent advances in artificial intelligence, particularly large language models (LLMs), have enabled virtual screening methods that reduce costs and improve efficiency. However, the growing complexity of these tools has limited their accessibility to wet-lab researchers. Multi-agent systems offer a promising solution by combining the interpretability of LLMs with the precision of specialized models and tools. In this work, we present MADD, a multi-agent system that builds and executes customized hit identification pipelines from natural language queries. MADD employs four coordinated agents to handle key subtasks in de novo compound generation and screening. We evaluate MADD across seven drug discovery cases and demonstrate its superior performance compared to existing LLM-based solutions. Using MADD, we pioneer the application of AI-first drug design to five biological targets and release the identified hit molecules. Finally, we introduce a new benchmark of query-molecule pairs and docking scores for over three million compounds to contribute to the agentic future of drug design.