ChatPaper.aiChatPaper

Lingshu-Cell: Ein generatives zelluläres Weltmodell für die Transkriptommodellierung hin zu virtuellen Zellen

Lingshu-Cell: A generative cellular world model for transcriptome modeling toward virtual cells

March 26, 2026
Autoren: Han Zhang, Guo-Hua Yuan, Chaohao Yuan, Tingyang Xu, Tian Bian, Hong Cheng, Wenbing Huang, Deli Zhao, Yu Rong
cs.AI

Zusammenfassung

Die Modellierung zellulärer Zustände und die Vorhersage ihrer Reaktionen auf Perturbationen stellen zentrale Herausforderungen in der Computational Biology und der Entwicklung virtueller Zellen dar. Bestehende Foundation-Modelle für die Einzelzell-Transkriptomik liefern leistungsstarke statische Repräsentationen, modellieren jedoch nicht explizit die Verteilung zellulärer Zustände für generative Simulationen. Hier stellen wir Lingshu-Cell vor, ein maskiertes diskretes Diffusionsmodell, das transkriptomische Zustandsverteilungen erlernt und konditionelle Simulationen unter Perturbation unterstützt. Indem es direkt in einem diskreten Token-Raum operiert, der mit der spärlichen, nicht-sequenziellen Natur von Einzelzell-Transkriptomdaten kompatibel ist, erfasst Lingshu-Cell komplexe transkriptomweite Expressionsabhängigkeiten über etwa 18.000 Gene hinweg, ohne auf vorherige Genauswahl – wie Filterung nach hoher Variabilität oder Sortierung nach Expressionslevel – angewiesen zu sein. Über verschiedene Gewebe und Spezies hinweg reproduziert Lingshu-Cell präzise transkriptomische Verteilungen, Markergen-Expressionsmuster und Zellsubtyp-Proportionen, was seine Fähigkeit zur Erfassung komplexer zellulärer Heterogenität demonstriert. Darüber hinaus kann Lingshu-Cell durch gemeinsames Einbetten von Zelltyp- oder Spenderidentität mit Perturbation whole-transcriptome Expressionsänderungen für neuartige Kombinationen von Identität und Perturbation vorhersagen. Es erzielt Spitzenleistungen im Virtual Cell Challenge H1-Benchmark für genetische Perturbationen sowie bei der Vorhersage zytokininduzierter Reaktionen in humanen PBMCs. Zusammengenommen etablieren diese Ergebnisse Lingshu-Cell als flexibles zelluläres Weltmodell für in-silico-Simulationen von Zellzuständen und Perturbationsantworten, wodurch die Grundlage für ein neues Paradigma in der biologischen Entdeckung und Perturbations-Screening gelegt wird.
English
Modeling cellular states and predicting their responses to perturbations are central challenges in computational biology and the development of virtual cells. Existing foundation models for single-cell transcriptomics provide powerful static representations, but they do not explicitly model the distribution of cellular states for generative simulation. Here, we introduce Lingshu-Cell, a masked discrete diffusion model that learns transcriptomic state distributions and supports conditional simulation under perturbation. By operating directly in a discrete token space that is compatible with the sparse, non-sequential nature of single-cell transcriptomic data, Lingshu-Cell captures complex transcriptome-wide expression dependencies across approximately 18,000 genes without relying on prior gene selection, such as filtering by high variability or ranking by expression level. Across diverse tissues and species, Lingshu-Cell accurately reproduces transcriptomic distributions, marker-gene expression patterns and cell-subtype proportions, demonstrating its ability to capture complex cellular heterogeneity. Moreover, by jointly embedding cell type or donor identity with perturbation, Lingshu-Cell can predict whole-transcriptome expression changes for novel combinations of identity and perturbation. It achieves leading performance on the Virtual Cell Challenge H1 genetic perturbation benchmark and in predicting cytokine-induced responses in human PBMCs. Together, these results establish Lingshu-Cell as a flexible cellular world model for in silico simulation of cell states and perturbation responses, laying the foundation for a new paradigm in biological discovery and perturbation screening.
PDF713April 2, 2026