ChatPaper.aiChatPaper

Lingshu-Cell: Генеративная клеточная модель мира для транскриптомного моделирования в направлении создания виртуальных клеток

Lingshu-Cell: A generative cellular world model for transcriptome modeling toward virtual cells

March 26, 2026
Авторы: Han Zhang, Guo-Hua Yuan, Chaohao Yuan, Tingyang Xu, Tian Bian, Hong Cheng, Wenbing Huang, Deli Zhao, Yu Rong
cs.AI

Аннотация

Моделирование клеточных состояний и прогнозирование их реакций на воздействия являются центральными задачами вычислительной биологии и разработки виртуальных клеток. Существующие базовые модели для транскриптомики единичных клеток предоставляют мощные статические представления, но явно не моделируют распределение клеточных состояний для генеративного моделирования. Здесь мы представляем Lingshu-Cell — модель маскированного дискретного диффузионного процесса, которая изучает распределения транскриптомных состояний и поддерживает условное моделирование при воздействиях. Работая непосредственно в дискретном пространстве токенов, совместимом с разреженной несеквентальной природой данных транскриптомики единичных клеток, Lingshu-Cell захватывает сложные транскриптом-широкие экспрессионные зависимости примерно для 18 000 генов без опоры на предварительный отбор генов, такой как фильтрация по высокой вариабельности или ранжирование по уровню экспрессии. На разнообразных тканях и видах Lingshu-Cell точно воспроизводит транскриптомные распределения, паттерны экспрессии генов-маркеров и пропорции клеточных подтипов, демонстрируя свою способность улавливать сложную клеточную гетерогенность. Более того, совместно встраивая тип клетки или идентичность донора с информацией о воздействии, Lingshu-Cell может предсказывать изменения экспрессии на уровне всего транскриптома для новых комбинаций идентичности и воздействия. Модель демонстрирует ведущую производительность на бенчмарке генетических воздействий H1 Virtual Cell Challenge и в предсказании цитокин-индуцированных ответов в человеческих PBMC. В совокупности эти результаты устанавливают Lingshu-Cell как гибкую клеточную мировую модель для in silico моделирования клеточных состояний и ответов на воздействия, закладывая основу для новой парадигмы в биологических открытиях и скрининге воздействий.
English
Modeling cellular states and predicting their responses to perturbations are central challenges in computational biology and the development of virtual cells. Existing foundation models for single-cell transcriptomics provide powerful static representations, but they do not explicitly model the distribution of cellular states for generative simulation. Here, we introduce Lingshu-Cell, a masked discrete diffusion model that learns transcriptomic state distributions and supports conditional simulation under perturbation. By operating directly in a discrete token space that is compatible with the sparse, non-sequential nature of single-cell transcriptomic data, Lingshu-Cell captures complex transcriptome-wide expression dependencies across approximately 18,000 genes without relying on prior gene selection, such as filtering by high variability or ranking by expression level. Across diverse tissues and species, Lingshu-Cell accurately reproduces transcriptomic distributions, marker-gene expression patterns and cell-subtype proportions, demonstrating its ability to capture complex cellular heterogeneity. Moreover, by jointly embedding cell type or donor identity with perturbation, Lingshu-Cell can predict whole-transcriptome expression changes for novel combinations of identity and perturbation. It achieves leading performance on the Virtual Cell Challenge H1 genetic perturbation benchmark and in predicting cytokine-induced responses in human PBMCs. Together, these results establish Lingshu-Cell as a flexible cellular world model for in silico simulation of cell states and perturbation responses, laying the foundation for a new paradigm in biological discovery and perturbation screening.
PDF713April 2, 2026