Cohérence géométrique des perturbations CRISPR unicellulaires révélant l'architecture régulatrice et prédisant le stress cellulaire
Geometric coherence of single-cell CRISPR perturbations reveals regulatory architecture and predicts cellular stress
April 17, 2026
Auteurs: Prashant C. Raju
cs.AI
Résumé
L'ingénierie du génome a atteint une précision remarquable au niveau de la séquence, mais prédire l'état transcriptomique qu'une cellule occupera après une perturbation reste un problème non résolu. Les cribles CRISPR à cellule unique mesurent la distance parcourue par les cellules par rapport à leur état non perturbé, mais cette amplitude d'effet ignore une question fondamentale : les cellules se déplacent-elles de manière cohérente ? Deux perturbations d'amplitude identique peuvent produire des résultats qualitativement différents si l'une entraîne les cellules de manière cohérente le long d'une trajectoire partagée tandis que l'autre les disperse dans l'espace d'expression. Nous introduisons une métrique de stabilité géométrique, Shesha, qui quantifie la cohérence directionnelle des réponses aux perturbations à cellule unique comme la similarité cosinus moyenne entre les vecteurs de déplacement individuels des cellules et la direction moyenne de perturbation. Sur cinq jeux de données CRISPR (plus de 2 200 perturbations couvrant des cribles CRISPRa, CRISPRi et poolés), la stabilité est fortement corrélée à l'amplitude de l'effet (ρ de Spearman = 0,75-0,97), avec une corrélation inter-jeux de données calibrée de 0,97. Fait crucial, les cas discordants où les deux métriques se découplent révèlent l'architecture régulatrice : les régulateurs maîtres pléiotropes tels que CEBPA et GATA1 paient une « taxe géométrique », produisant des déplacements importants mais incohérents, tandis que les facteurs spécifiques à la lignée tels que KLF1 produisent des réponses étroitement coordonnées. Après contrôle de l'amplitude, l'instabilité géométrique est indépendamment associée à une activation chaperon élevée (HSPA5/BiP ; ρ partiel = -0,34 et -0,21 entre les jeux de données), et le quadrant haute stabilité/fort stress est systématiquement appauvri. La relation amplitude-stabilité persiste dans les plongements du modèle fondation scGPT, confirmant qu'il s'agit d'une propriété de l'espace d'état biologique plutôt que de la projection linéaire. La stabilité des perturbations fournit un axe complémentaire pour la hiérarchisation des hits dans les cribles, le contrôle qualité phénotypique dans la production cellulaire et l'évaluation des prédictions de perturbations in silico.
English
Genome engineering has achieved remarkable sequence-level precision, yet predicting the transcriptomic state that a cell will occupy after perturbation remains an open problem. Single-cell CRISPR screens measure how far cells move from their unperturbed state, but this effect magnitude ignores a fundamental question: do the cells move together? Two perturbations with identical magnitude can produce qualitatively different outcomes if one drives cells coherently along a shared trajectory while the other scatters them across expression space. We introduce a geometric stability metric, Shesha, that quantifies the directional coherence of single-cell perturbation responses as the mean cosine similarity between individual cell shift vectors and the mean perturbation direction. Across five CRISPR datasets (2,200+ perturbations spanning CRISPRa, CRISPRi, and pooled screens), stability correlates strongly with effect magnitude (Spearman ρ=0.75-0.97), with a calibrated cross-dataset correlation of 0.97. Crucially, discordant cases where the two metrics decouple expose regulatory architecture: pleiotropic master regulators such as CEBPA and GATA1 pay a "geometric tax," producing large but incoherent shifts, while lineage-specific factors such as KLF1 produce tightly coordinated responses. After controlling for magnitude, geometric instability is independently associated with elevated chaperone activation (HSPA5/BiP; ρ_{partial}=-0.34 and -0.21 across datasets), and the high-stability/high-stress quadrant is systematically depleted. The magnitude-stability relationship persists in scGPT foundation model embeddings, confirming it is a property of biological state space rather than linear projection. Perturbation stability provides a complementary axis for hit prioritization in screens, phenotypic quality control in cell manufacturing, and evaluation of in silico perturbation predictions.