ChatPaper.aiChatPaper

CellForge: Agentengesteuertes Design virtueller Zellmodelle

CellForge: Agentic Design of Virtual Cell Models

August 4, 2025
papers.authors: Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, Yan Cui, Daniel Shao, Weixu Wang, Fang Wu, Yuchen Zhuang, Wenqi Shi, Zhi Huang, Arman Cohan, Xihong Lin, Fabian Theis, Smita Krishnaswamy, Mark Gerstein
cs.AI

papers.abstract

Die Modellierung virtueller Zellen stellt eine aufstrebende Grenzdisziplin an der Schnittstelle von künstlicher Intelligenz und Biologie dar, die darauf abzielt, Größen wie Reaktionen auf verschiedene Störungen quantitativ vorherzusagen. Die autonome Erstellung von Computermodellen für virtuelle Zellen ist jedoch aufgrund der Komplexität biologischer Systeme, der Heterogenität der Datenmodalitäten und der Notwendigkeit domänenspezifischer Expertise über mehrere Disziplinen hinweg eine Herausforderung. Hier stellen wir CellForge vor, ein agentenbasiertes System, das einen Multi-Agenten-Rahmen nutzt, um präsentierte biologische Datensätze und Forschungsziele direkt in optimierte Computermodelle für virtuelle Zellen umzuwandeln. Genauer gesagt gibt CellForge, wenn nur Rohdaten aus Einzelzell-Multi-Omics und Aufgabenbeschreibungen als Eingabe vorliegen, sowohl eine optimierte Modellarchitektur als auch ausführbaren Code für das Training von Modellen virtueller Zellen und die Inferenz aus. Das Framework integriert drei Kernmodule: Aufgabenanalyse zur Charakterisierung des präsentierten Datensatzes und zur Recherche relevanter Literatur, Methodendesign, bei dem spezialisierte Agenten gemeinsam optimierte Modellierungsstrategien entwickeln, und Experimentdurchführung für die automatische Generierung von Code. Die Agenten im Design-Modul sind in Experten mit unterschiedlichen Perspektiven und einen zentralen Moderator unterteilt und müssen gemeinsam Lösungen austauschen, bis sie einen vernünftigen Konsens erreichen. Wir demonstrieren die Fähigkeiten von CellForge in der Vorhersage von Einzelzellstörungen unter Verwendung von sechs verschiedenen Datensätzen, die Gen-Knockouts, Medikamentenbehandlungen und Zytokinstimulationen über mehrere Modalitäten hinweg umfassen. CellForge übertrifft durchweg aufgabenbezogene State-of-the-Art-Methoden. Insgesamt zeigt CellForge, wie iterative Interaktionen zwischen LLM-Agenten mit unterschiedlichen Perspektiven bessere Lösungen bieten als die direkte Bewältigung einer Modellierungsherausforderung. Unser Code ist öffentlich verfügbar unter https://github.com/gersteinlab/CellForge.
English
Virtual cell modeling represents an emerging frontier at the intersection of artificial intelligence and biology, aiming to predict quantities such as responses to diverse perturbations quantitatively. However, autonomously building computational models for virtual cells is challenging due to the complexity of biological systems, the heterogeneity of data modalities, and the need for domain-specific expertise across multiple disciplines. Here, we introduce CellForge, an agentic system that leverages a multi-agent framework that transforms presented biological datasets and research objectives directly into optimized computational models for virtual cells. More specifically, given only raw single-cell multi-omics data and task descriptions as input, CellForge outputs both an optimized model architecture and executable code for training virtual cell models and inference. The framework integrates three core modules: Task Analysis for presented dataset characterization and relevant literature retrieval, Method Design, where specialized agents collaboratively develop optimized modeling strategies, and Experiment Execution for automated generation of code. The agents in the Design module are separated into experts with differing perspectives and a central moderator, and have to collaboratively exchange solutions until they achieve a reasonable consensus. We demonstrate CellForge's capabilities in single-cell perturbation prediction, using six diverse datasets that encompass gene knockouts, drug treatments, and cytokine stimulations across multiple modalities. CellForge consistently outperforms task-specific state-of-the-art methods. Overall, CellForge demonstrates how iterative interaction between LLM agents with differing perspectives provides better solutions than directly addressing a modeling challenge. Our code is publicly available at https://github.com/gersteinlab/CellForge.
PDF361August 5, 2025