Coherencia geométrica de las perturbaciones CRISPR unicelulares revela la arquitectura regulatoria y predice el estrés celular
Geometric coherence of single-cell CRISPR perturbations reveals regulatory architecture and predicts cellular stress
April 17, 2026
Autores: Prashant C. Raju
cs.AI
Resumen
La ingeniería genómica ha logrado una precisión notable a nivel de secuencia, pero predecir el estado transcriptómico que una célula ocupará tras una perturbación sigue siendo un problema abierto. Los cribados CRISPR de células individuales miden cuánto se alejan las células de su estado no perturbado, pero esta magnitud del efecto ignora una cuestión fundamental: ¿se mueven las células de forma coordinada? Dos perturbaciones con idéntica magnitud pueden producir resultados cualitativamente diferentes si una impulsa a las células de manera coherente a lo largo de una trayectoria compartida, mientras que la otra las dispersa por el espacio de expresión. Introducimos una métrica de estabilidad geométrica, Shesha, que cuantifica la coherencia direccional de las respuestas a perturbaciones en células individuales como la similitud de coseno media entre los vectores de desplazamiento celular individuales y la dirección media de la perturbación. En cinco conjuntos de datos CRISPR (más de 2.200 perturbaciones que abarcan CRISPRa, CRISPRi y cribados agrupados), la estabilidad se correlaciona fuertemente con la magnitud del efecto (Spearman ρ=0.75-0.97), con una correlación calibrada entre conjuntos de datos de 0.97. Crucialmente, los casos discordantes donde las dos métricas se desacoplan exponen la arquitectura reguladora: reguladores maestros pleiotrópicos como CEBPA y GATA1 pagan un "impuesto geométrico", produciendo desplazamientos grandes pero incoherentes, mientras que factores específicos de linaje como KLF1 producen respuestas estrechamente coordinadas. Tras controlar por la magnitud, la inestabilidad geométrica se asocia independientemente con una elevada activación de chaperonas (HSPA5/BiP; ρ_parcial=-0.34 y -0.21 entre conjuntos de datos), y el cuadrante de alta estabilidad/alto estrés está sistemáticamente agotado. La relación magnitud-estabilidad persiste en los *embeddings* del modelo fundacional scGPT, confirmando que es una propiedad del espacio de estados biológico y no de la proyección lineal. La estabilidad de la perturbación proporciona un eje complementario para la priorización de *hits* en cribados, el control de calidad fenotípico en la fabricación de células y la evaluación de predicciones de perturbaciones *in silico*.
English
Genome engineering has achieved remarkable sequence-level precision, yet predicting the transcriptomic state that a cell will occupy after perturbation remains an open problem. Single-cell CRISPR screens measure how far cells move from their unperturbed state, but this effect magnitude ignores a fundamental question: do the cells move together? Two perturbations with identical magnitude can produce qualitatively different outcomes if one drives cells coherently along a shared trajectory while the other scatters them across expression space. We introduce a geometric stability metric, Shesha, that quantifies the directional coherence of single-cell perturbation responses as the mean cosine similarity between individual cell shift vectors and the mean perturbation direction. Across five CRISPR datasets (2,200+ perturbations spanning CRISPRa, CRISPRi, and pooled screens), stability correlates strongly with effect magnitude (Spearman ρ=0.75-0.97), with a calibrated cross-dataset correlation of 0.97. Crucially, discordant cases where the two metrics decouple expose regulatory architecture: pleiotropic master regulators such as CEBPA and GATA1 pay a "geometric tax," producing large but incoherent shifts, while lineage-specific factors such as KLF1 produce tightly coordinated responses. After controlling for magnitude, geometric instability is independently associated with elevated chaperone activation (HSPA5/BiP; ρ_{partial}=-0.34 and -0.21 across datasets), and the high-stability/high-stress quadrant is systematically depleted. The magnitude-stability relationship persists in scGPT foundation model embeddings, confirming it is a property of biological state space rather than linear projection. Perturbation stability provides a complementary axis for hit prioritization in screens, phenotypic quality control in cell manufacturing, and evaluation of in silico perturbation predictions.