ChatPaper.aiChatPaper

Lingshu-Cell: 가상 세포 구현을 위한 전사체 모델링 생성형 세포 세계 모델

Lingshu-Cell: A generative cellular world model for transcriptome modeling toward virtual cells

March 26, 2026
저자: Han Zhang, Guo-Hua Yuan, Chaohao Yuan, Tingyang Xu, Tian Bian, Hong Cheng, Wenbing Huang, Deli Zhao, Yu Rong
cs.AI

초록

세포 상태 모델링 및 이의 교란에 대한 반응 예측은 계산 생물학과 가상 세포 개발의 핵심 과제입니다. 단일 세포 전사체학을 위한 기존 파운데이션 모델은 강력한 정적 표현을 제공하지만, 생성적 시뮬레이션을 위한 세포 상태 분포를 명시적으로 모델링하지는 않습니다. 본 연구에서는 전사체 상태 분포를 학습하고 교란 조건 하에서의 조건부 시뮬레이션을 지원하는 마스크드 이산 확산 모델인 Lingshu-Cell을 소개합니다. Lingshu-Cell은 단일 세포 전사체 데이터의 희소성 및 비순차적 특성과 호환되는 이산 토큰 공간에서 직접 작동함으로써, 높은 변동성 필터링이나 발현 수준 순위 지정과 같은 사전 유전자 선별 없이도 약 18,000개 유전자 전반에 걸친 복잡한 전사체 수준의 발현 상관관계를 포착합니다. 다양한 조직과 종에서 Lingshu-Cell은 전사체 분포, 마커 유전자 발현 패턴 및 세포 아형 비율을 정확하게 재현하여 복잡한 세포 이질성을 포착하는 능력을 입증합니다. 더 나아가, 세포 유형 또는 기증자 식별자와 교란 정보를 공동으로 임베딩함으로써 Lingshu-Cell은 새로운 식별자와 교란의 조합에 대한 전체 전사체 발현 변화를 예측할 수 있습니다. 이 모델은 Virtual Cell Challenge H1 유전적 교란 벤치마크와 인간 PBMC에서의 사이토카인 유도 반응 예측에서 선도적인 성능을 달성했습니다. 종합하면, 이러한 결과들은 Lingshu-Cell을 세포 상태 및 교란 반응의 전산 시뮬레이션을 위한 유연한 세포 세계 모델로 입증하며, 생물학적 발견과 교란 스크리닝을 위한 새로운 패러다임의 기초를 마련합니다.
English
Modeling cellular states and predicting their responses to perturbations are central challenges in computational biology and the development of virtual cells. Existing foundation models for single-cell transcriptomics provide powerful static representations, but they do not explicitly model the distribution of cellular states for generative simulation. Here, we introduce Lingshu-Cell, a masked discrete diffusion model that learns transcriptomic state distributions and supports conditional simulation under perturbation. By operating directly in a discrete token space that is compatible with the sparse, non-sequential nature of single-cell transcriptomic data, Lingshu-Cell captures complex transcriptome-wide expression dependencies across approximately 18,000 genes without relying on prior gene selection, such as filtering by high variability or ranking by expression level. Across diverse tissues and species, Lingshu-Cell accurately reproduces transcriptomic distributions, marker-gene expression patterns and cell-subtype proportions, demonstrating its ability to capture complex cellular heterogeneity. Moreover, by jointly embedding cell type or donor identity with perturbation, Lingshu-Cell can predict whole-transcriptome expression changes for novel combinations of identity and perturbation. It achieves leading performance on the Virtual Cell Challenge H1 genetic perturbation benchmark and in predicting cytokine-induced responses in human PBMCs. Together, these results establish Lingshu-Cell as a flexible cellular world model for in silico simulation of cell states and perturbation responses, laying the foundation for a new paradigm in biological discovery and perturbation screening.
PDF713April 2, 2026