Геометрическая когерентность CRISPR-возмущений на уровне отдельных клеток раскрывает регуляторную архитектуру и предсказывает клеточный стресс

Аннотация

Генетическая инженерия достигла выдающейся точности на уровне последовательностей, однако предсказание транскриптомного состояния, которое клетка займет после воздействия, остается нерешенной проблемой. Скрининги CRISPR на уровне единичных клеток измеряют, насколько далеко клетки отходят от своего невозмущенного состояния, но эта величина эффекта игнорирует фундаментальный вопрос: движутся ли клетки согласованно? Два воздействия с одинаковой величиной эффекта могут приводить к качественно разным результатам, если одно направляет клетки когерентно по общей траектории, а другое рассеивает их в пространстве экспрессии. Мы вводим метрику геометрической стабильности Shesha, которая количественно определяет направленную когерентность ответов единичных клеток на воздействие как среднее косинусное сходство между векторами смещения отдельных клеток и средним направлением воздействия. На пяти наборах данных CRISPR (более 2200 воздействий, включая CRISPRa, CRISPRi и пуловые скрининги) стабильность сильно коррелирует с величиной эффекта (ρ Спирмена = 0.75–0.97), с калиброванной кросс-наборной корреляцией 0.97. Ключевым моментом является то, что случаи рассогласования, когда две метрики расходятся, выявляют регуляторную архитектуру: плейотропные мастер-регуляторы, такие как CEBPA и GATA1, платят «геометрическую цену», вызывая большие, но некогерентные смещения, тогда как факторы, специфичные для линии, такие как KLF1, порождают строго координированные ответы. После поправки на величину эффекта геометрическая нестабильность независимо ассоциирована с повышенной активацией шаперонов (HSPA5/BiP; ρ_парциальный = -0.34 и -0.21 по наборам данных), и квадрант высокой стабильности/высокого стресса систематически обеднен. Взаимосвязь величины эффекта и стабильности сохраняется в эмбеддингах базовой модели scGPT, подтверждая, что это свойство биологического пространства состояний, а не линейной проекции. Стабильность ответа на воздействие предоставляет дополнительную ось для приоритизации хитов в скринингах, контроля качества фенотипа в клеточном производстве и оценки предсказаний in silico воздействий.

English

Genome engineering has achieved remarkable sequence-level precision, yet predicting the transcriptomic state that a cell will occupy after perturbation remains an open problem. Single-cell CRISPR screens measure how far cells move from their unperturbed state, but this effect magnitude ignores a fundamental question: do the cells move together? Two perturbations with identical magnitude can produce qualitatively different outcomes if one drives cells coherently along a shared trajectory while the other scatters them across expression space. We introduce a geometric stability metric, Shesha, that quantifies the directional coherence of single-cell perturbation responses as the mean cosine similarity between individual cell shift vectors and the mean perturbation direction. Across five CRISPR datasets (2,200+ perturbations spanning CRISPRa, CRISPRi, and pooled screens), stability correlates strongly with effect magnitude (Spearman ρ=0.75-0.97), with a calibrated cross-dataset correlation of 0.97. Crucially, discordant cases where the two metrics decouple expose regulatory architecture: pleiotropic master regulators such as CEBPA and GATA1 pay a "geometric tax," producing large but incoherent shifts, while lineage-specific factors such as KLF1 produce tightly coordinated responses. After controlling for magnitude, geometric instability is independently associated with elevated chaperone activation (HSPA5/BiP; ρ_{partial}=-0.34 and -0.21 across datasets), and the high-stability/high-stress quadrant is systematically depleted. The magnitude-stability relationship persists in scGPT foundation model embeddings, confirming it is a property of biological state space rather than linear projection. Perturbation stability provides a complementary axis for hit prioritization in screens, phenotypic quality control in cell manufacturing, and evaluation of in silico perturbation predictions.

Геометрическая когерентность CRISPR-возмущений на уровне отдельных клеток раскрывает регуляторную архитектуру и предсказывает клеточный стресс

Geometric coherence of single-cell CRISPR perturbations reveals regulatory architecture and predicts cellular stress

Аннотация

Support