Revisiter l'hypothèse de la représentation platonicienne : une perspective aristotélicienne
Revisiting the Platonic Representation Hypothesis: An Aristotelian View
February 16, 2026
papers.authors: Fabian Gröger, Shuo Wen, Maria Brbić
cs.AI
papers.abstract
L'hypothèse de représentation platonicienne suggère que les représentations des réseaux de neuronaux convergent vers un modèle statistique commun de la réalité. Nous démontrons que les métriques existantes utilisées pour mesurer la similarité représentationnelle sont biaisées par l'échelle du réseau : l'augmentation de la profondeur ou de la largeur du modèle peut systématiquement gonfler les scores de similarité représentationnelle. Pour corriger ces effets, nous introduisons un cadre de calibration nulle basé sur les permutations qui transforme toute métrique de similarité représentationnelle en un score calibré avec des garanties statistiques. Nous réexaminons l'hypothèse de représentation platonicienne avec notre cadre de calibration, ce qui révèle une image nuancée : la convergence apparente rapportée par les mesures spectrales globales disparaît largement après calibration, tandis que la similarité des voisinages locaux, mais pas les distances locales, conserve un accord significatif entre les différentes modalités. Sur la base de ces résultats, nous proposons l'hypothèse de représentation aristotélicienne : les représentations dans les réseaux de neuronaux convergent vers des relations de voisinage locales partagées.
English
The Platonic Representation Hypothesis suggests that representations from neural networks are converging to a common statistical model of reality. We show that the existing metrics used to measure representational similarity are confounded by network scale: increasing model depth or width can systematically inflate representational similarity scores. To correct these effects, we introduce a permutation-based null-calibration framework that transforms any representational similarity metric into a calibrated score with statistical guarantees. We revisit the Platonic Representation Hypothesis with our calibration framework, which reveals a nuanced picture: the apparent convergence reported by global spectral measures largely disappears after calibration, while local neighborhood similarity, but not local distances, retains significant agreement across different modalities. Based on these findings, we propose the Aristotelian Representation Hypothesis: representations in neural networks are converging to shared local neighborhood relationships.