MADD: Multi-Agent Drug Discovery Orchestra
MADD: Multi-Agent Drug Discovery Orchestra
November 11, 2025
papers.authors: Gleb V. Solovev, Alina B. Zhidkovskaya, Anastasia Orlova, Nina Gubina, Anastasia Vepreva, Rodion Golovinskii, Ilya Tonkii, Ivan Dubrovsky, Ivan Gurev, Dmitry Gilemkhanov, Denis Chistiakov, Timur A. Aliev, Ivan Poddiakov, Galina Zubkova, Ekaterina V. Skorb, Vladimir Vinogradov, Alexander Boukhanovsky, Nikolay Nikitin, Andrei Dmitrenko, Anna Kalyuzhnaya, Andrey Savchenko
cs.AI
papers.abstract
Die Identifizierung von Wirkstoffkandidaten (Hit Identification) stellt eine zentrale Herausforderung in der frühen Wirkstoffentwicklung dar und erforderte traditionell erhebliche experimentelle Ressourcen. Jüngste Fortschritte in der künstlichen Intelligenz, insbesondere bei großen Sprachmodellen (LLMs), haben virtuelle Screening-Methoden ermöglicht, die Kosten senken und die Effizienz steigern. Die zunehmende Komplexität dieser Werkzeuge hat ihre Zugänglichkeit für Forscher im Labor jedoch eingeschränkt. Multi-Agenten-Systeme bieten eine vielversprechende Lösung, indem sie die Interpretierbarkeit von LLMs mit der Präzision spezialisierter Modelle und Werkzeuge kombinieren. In dieser Arbeit stellen wir MADD vor, ein Multi-Agenten-System, das aus natürlichen Sprachabfragen heraus maßgeschneiderte Pipelines zur Identifizierung von Wirkstoffkandidaten erstellt und ausführt. MADD setzt vier koordinierte Agenten ein, um Schlüsselteilaufgaben bei der de novo-Generierung und dem Screening von Verbindungen zu bewältigen. Wir evaluieren MADD anhand von sieben Wirkstoffentwicklungsfällen und demonstrieren seine überlegene Leistung im Vergleich zu bestehenden LLM-basierten Lösungen. Mit MADD bahnen wir den Weg für einen KI-zentrierten Wirkstoffdesign-Ansatz für fünf biologische Targets und veröffentlichen die identifizierten Wirkstoffkandidaten. Abschließend stellen wir einen neuen Benchmark mit Abfrage-Molekül-Paaren und Docking-Scores für über drei Millionen Verbindungen vor, um zur agentenbasierten Zukunft der Wirkstoffentwicklung beizutragen.
English
Hit identification is a central challenge in early drug discovery, traditionally requiring substantial experimental resources. Recent advances in artificial intelligence, particularly large language models (LLMs), have enabled virtual screening methods that reduce costs and improve efficiency. However, the growing complexity of these tools has limited their accessibility to wet-lab researchers. Multi-agent systems offer a promising solution by combining the interpretability of LLMs with the precision of specialized models and tools. In this work, we present MADD, a multi-agent system that builds and executes customized hit identification pipelines from natural language queries. MADD employs four coordinated agents to handle key subtasks in de novo compound generation and screening. We evaluate MADD across seven drug discovery cases and demonstrate its superior performance compared to existing LLM-based solutions. Using MADD, we pioneer the application of AI-first drug design to five biological targets and release the identified hit molecules. Finally, we introduce a new benchmark of query-molecule pairs and docking scores for over three million compounds to contribute to the agentic future of drug design.