Геометрическая устойчивость: недостающее измерение репрезентаций
Geometric Stability: The Missing Axis of Representations
January 14, 2026
Авторы: Prashant C. Raju
cs.AI
Аннотация
Анализ изученных представлений имеет слепое пятно: он фокусируется на сходстве, измеряя, насколько близко эмбеддинги соответствуют внешним ориентирам, но сходство раскрывает лишь то, что представлено, а не то, насколько эта структура устойчива. Мы вводим геометрическую стабильность — отдельное измерение, которое количественно оценивает, насколько надежно геометрия представлений сохраняется при возмущениях, и представляем Shesha, фреймворк для её измерения. На примере 2463 конфигураций в семи областях мы показываем, что стабильность и сходство эмпирически не коррелируют (ρ≈0.01) и механистически различны: метрики сходства коллапсируют после удаления главных компонент, в то время как стабильность сохраняет чувствительность к мелкозернистой структуре многообразия. Это различие дает практическую пользу: для мониторинга безопасности стабильность действует как функциональный геометрический канарейка, обнаруживая структурный дрейф почти в 2 раза чувствительнее, чем CKA, и отфильтровывая нефункциональный шум, вызывающий ложные срабатывания в жестких метриках расстояния; для управляемости контролируемая стабильность предсказывает линейную управляемость (ρ=0.89–0.96); для выбора моделей стабильность диссоциирует от переносимости, выявляя геометрическую цену, которую влечет оптимизация на перенос. За пределами машинного обучения стабильность предсказывает когерентность CRISPR-пертурбаций и нейроповеденческую связь. Количественно оценивая, насколько надежно системы сохраняют структуру, геометрическая стабильность предоставляет необходимое дополнение к сходству для аудита представлений в биологических и вычислительных системах.
English
Analysis of learned representations has a blind spot: it focuses on similarity, measuring how closely embeddings align with external references, but similarity reveals only what is represented, not whether that structure is robust. We introduce geometric stability, a distinct dimension that quantifies how reliably representational geometry holds under perturbation, and present Shesha, a framework for measuring it. Across 2,463 configurations in seven domains, we show that stability and similarity are empirically uncorrelated (ρapprox 0.01) and mechanistically distinct: similarity metrics collapse after removing the top principal components, while stability retains sensitivity to fine-grained manifold structure. This distinction yields actionable insights: for safety monitoring, stability acts as a functional geometric canary, detecting structural drift nearly 2times more sensitively than CKA while filtering out the non-functional noise that triggers false alarms in rigid distance metrics; for controllability, supervised stability predicts linear steerability (ρ= 0.89-0.96); for model selection, stability dissociates from transferability, revealing a geometric tax that transfer optimization incurs. Beyond machine learning, stability predicts CRISPR perturbation coherence and neural-behavioral coupling. By quantifying how reliably systems maintain structure, geometric stability provides a necessary complement to similarity for auditing representations across biological and computational systems.