Coerenza geometrica delle perturbazioni CRISPR a singola cellula rivela l'architettura regolatoria e predice lo stress cellulare
Geometric coherence of single-cell CRISPR perturbations reveals regulatory architecture and predicts cellular stress
April 17, 2026
Autori: Prashant C. Raju
cs.AI
Abstract
L'ingegneria genomica ha raggiunto una precisione notevole a livello di sequenza, ma prevedere lo stato trascrittomico che una cellula occuperà dopo una perturbazione rimane un problema aperto. Gli screening CRISPR a cellula singola misurano quanto le cellule si allontanano dal loro stato non perturbato, ma questa magnitudo dell'effetto ignora una domanda fondamentale: le cellule si muovono insieme? Due perturbazioni con magnitudo identica possono produrre esiti qualitativamente diversi se una spinge le cellule coerentemente lungo una traiettoria condivisa mentre l'altra le disperde nello spazio di espressione genica. Introduciamo una metrica di stabilità geometrica, Shesha, che quantifica la coerenza direzionale delle risposte cellulari alla perturbazione come la similarità del coseno media tra i vettori di spostamento delle singole cellule e la direzione media della perturbazione. Attraverso cinque set di dati CRISPR (oltre 2.200 perturbazioni che comprendono CRISPRa, CRISPRi e screening pooled), la stabilità correla fortemente con la magnitudo dell'effetto (Spearman ρ=0.75-0.97), con una correlazione calibrata tra i set di dati di 0.97. Crucialmente, i casi discordanti in cui le due metrici si disaccoppiano rivelano l'architettura regolatoria: regolatori master pleiotropici come CEBPA e GATA1 pagano una "tassa geometrica", producendo spostamenti ampi ma incoerenti, mentre fattori specifici del lignaggio come KLF1 producono risposte strettamente coordinate. Dopo aver controllato per la magnitudo, l'instabilità geometrica è indipendentemente associata a un'elevata attivazione delle proteine chaperone (HSPA5/BiP; ρ_parziale=-0.34 e -0.21 tra i set di dati), e il quadrante ad alta stabilità/alto stress è sistematicamente depauperato. La relazione magnitudo-stabilità persiste negli embedding del modello fondazionale scGPT, confermando che è una proprietà dello spazio degli stati biologici piuttosto che una proiezione lineare. La stabilità della perturbazione fornisce un asse complementare per la prioritarizzazione dei "hit" negli screening, il controllo di qualità fenotipico nella produzione cellulare e la valutazione delle previsioni di perturbazione in silico.
English
Genome engineering has achieved remarkable sequence-level precision, yet predicting the transcriptomic state that a cell will occupy after perturbation remains an open problem. Single-cell CRISPR screens measure how far cells move from their unperturbed state, but this effect magnitude ignores a fundamental question: do the cells move together? Two perturbations with identical magnitude can produce qualitatively different outcomes if one drives cells coherently along a shared trajectory while the other scatters them across expression space. We introduce a geometric stability metric, Shesha, that quantifies the directional coherence of single-cell perturbation responses as the mean cosine similarity between individual cell shift vectors and the mean perturbation direction. Across five CRISPR datasets (2,200+ perturbations spanning CRISPRa, CRISPRi, and pooled screens), stability correlates strongly with effect magnitude (Spearman ρ=0.75-0.97), with a calibrated cross-dataset correlation of 0.97. Crucially, discordant cases where the two metrics decouple expose regulatory architecture: pleiotropic master regulators such as CEBPA and GATA1 pay a "geometric tax," producing large but incoherent shifts, while lineage-specific factors such as KLF1 produce tightly coordinated responses. After controlling for magnitude, geometric instability is independently associated with elevated chaperone activation (HSPA5/BiP; ρ_{partial}=-0.34 and -0.21 across datasets), and the high-stability/high-stress quadrant is systematically depleted. The magnitude-stability relationship persists in scGPT foundation model embeddings, confirming it is a property of biological state space rather than linear projection. Perturbation stability provides a complementary axis for hit prioritization in screens, phenotypic quality control in cell manufacturing, and evaluation of in silico perturbation predictions.