MADD:マルチエージェント創薬オーケストラ
MADD: Multi-Agent Drug Discovery Orchestra
November 11, 2025
著者: Gleb V. Solovev, Alina B. Zhidkovskaya, Anastasia Orlova, Nina Gubina, Anastasia Vepreva, Rodion Golovinskii, Ilya Tonkii, Ivan Dubrovsky, Ivan Gurev, Dmitry Gilemkhanov, Denis Chistiakov, Timur A. Aliev, Ivan Poddiakov, Galina Zubkova, Ekaterina V. Skorb, Vladimir Vinogradov, Alexander Boukhanovsky, Nikolay Nikitin, Andrei Dmitrenko, Anna Kalyuzhnaya, Andrey Savchenko
cs.AI
要旨
ヒト化合物同定は創薬初期段階における中核的課題であり、従来は多大な実験リソースを要してきました。人工知能、特に大規模言語モデル(LLM)の最近の進歩により、コスト削減と効率向上を実現する仮想スクリーニング手法が可能になっています。しかし、これらのツールの複雑化に伴い、ウェットラボ研究者による利用が制限される問題が生じています。マルチエージェントシステムは、LLMの解釈可能性と専門モデル・ツールの精密性を組み合わせることで、この課題に対する有望な解決策を提供します。本研究では、自然言語クエリからカスタマイズされたヒト化合物同定パイプラインを構築・実行するマルチエージェントシステム「MADD」を提案します。MADDは4つの連携エージェントを採用し、デノボ化合物生成とスクリーニングにおける主要なサブタスクを処理します。7つの創薬ケースでMADDを評価し、既存のLLMベースソリューションに対する優位性を実証します。MADDを用いて、5つの生物学的標的に対するAIファースト創薬デザインの先駆的応用を実現し、同定されたヒト分子を公開します。最後に、300万以上の化合物に対するクエリ-分子ペアとドッキングスコアから成る新規ベンチマークを導入し、創薬デザインのエージェント化の未来に貢献します。
English
Hit identification is a central challenge in early drug discovery, traditionally requiring substantial experimental resources. Recent advances in artificial intelligence, particularly large language models (LLMs), have enabled virtual screening methods that reduce costs and improve efficiency. However, the growing complexity of these tools has limited their accessibility to wet-lab researchers. Multi-agent systems offer a promising solution by combining the interpretability of LLMs with the precision of specialized models and tools. In this work, we present MADD, a multi-agent system that builds and executes customized hit identification pipelines from natural language queries. MADD employs four coordinated agents to handle key subtasks in de novo compound generation and screening. We evaluate MADD across seven drug discovery cases and demonstrate its superior performance compared to existing LLM-based solutions. Using MADD, we pioneer the application of AI-first drug design to five biological targets and release the identified hit molecules. Finally, we introduce a new benchmark of query-molecule pairs and docking scores for over three million compounds to contribute to the agentic future of drug design.