ChatPaper.aiChatPaper

CellForge: Агентное проектирование виртуальных моделей клеток

CellForge: Agentic Design of Virtual Cell Models

August 4, 2025
Авторы: Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, Yan Cui, Daniel Shao, Weixu Wang, Fang Wu, Yuchen Zhuang, Wenqi Shi, Zhi Huang, Arman Cohan, Xihong Lin, Fabian Theis, Smita Krishnaswamy, Mark Gerstein
cs.AI

Аннотация

Моделирование виртуальных клеток представляет собой новую область на стыке искусственного интеллекта и биологии, направленную на количественное предсказание таких параметров, как реакции на различные возмущения. Однако автономное построение вычислительных моделей для виртуальных клеток является сложной задачей из-за сложности биологических систем, неоднородности типов данных и необходимости междисциплинарных знаний. В данной работе мы представляем CellForge — агентную систему, которая использует многоагентный фреймворк для преобразования предоставленных биологических данных и исследовательских задач непосредственно в оптимизированные вычислительные модели виртуальных клеток. В частности, получая на вход только сырые одноклеточные мультиомные данные и описания задач, CellForge выдает как оптимизированную архитектуру модели, так и исполняемый код для обучения моделей виртуальных клеток и их применения. Фреймворк интегрирует три основных модуля: анализ задач для характеристики предоставленных данных и поиска релевантной литературы, проектирование методов, где специализированные агенты совместно разрабатывают оптимизированные стратегии моделирования, и выполнение экспериментов для автоматической генерации кода. Агенты в модуле проектирования разделены на экспертов с различными подходами и центрального модератора, которые совместно обмениваются решениями до достижения разумного консенсуса. Мы демонстрируем возможности CellForge в предсказании одноклеточных возмущений, используя шесть различных наборов данных, включающих нокауты генов, обработку лекарствами и стимуляции цитокинами в различных модальностях. CellForge стабильно превосходит специализированные современные методы. В целом, CellForge демонстрирует, как итеративное взаимодействие между агентами с различными подходами позволяет находить более эффективные решения по сравнению с прямым решением задачи моделирования. Наш код доступен по адресу https://github.com/gersteinlab/CellForge.
English
Virtual cell modeling represents an emerging frontier at the intersection of artificial intelligence and biology, aiming to predict quantities such as responses to diverse perturbations quantitatively. However, autonomously building computational models for virtual cells is challenging due to the complexity of biological systems, the heterogeneity of data modalities, and the need for domain-specific expertise across multiple disciplines. Here, we introduce CellForge, an agentic system that leverages a multi-agent framework that transforms presented biological datasets and research objectives directly into optimized computational models for virtual cells. More specifically, given only raw single-cell multi-omics data and task descriptions as input, CellForge outputs both an optimized model architecture and executable code for training virtual cell models and inference. The framework integrates three core modules: Task Analysis for presented dataset characterization and relevant literature retrieval, Method Design, where specialized agents collaboratively develop optimized modeling strategies, and Experiment Execution for automated generation of code. The agents in the Design module are separated into experts with differing perspectives and a central moderator, and have to collaboratively exchange solutions until they achieve a reasonable consensus. We demonstrate CellForge's capabilities in single-cell perturbation prediction, using six diverse datasets that encompass gene knockouts, drug treatments, and cytokine stimulations across multiple modalities. CellForge consistently outperforms task-specific state-of-the-art methods. Overall, CellForge demonstrates how iterative interaction between LLM agents with differing perspectives provides better solutions than directly addressing a modeling challenge. Our code is publicly available at https://github.com/gersteinlab/CellForge.
PDF361August 5, 2025