Meten van de symmetrie-data-uitwisselingssnelheid

Samenvatting

De equivalentietheorie voorspelt dat een architecturale symmetrieprior de steekproefcomplexiteit reduceert met een factor |G|; dit wordt breed geciteerd maar zelden gemeten als een schalingswet met controles die de prior scheiden van zijn verstorende factoren. In een gecontroleerde C_n-symmetrische taak rapporteren we drie bevindingen. Ten eerste is een verkeerde-groepcontrole met identieke baanlengte en vergelijkbare rekenkracht slechter dan geen beperking (gezamenlijk paarsgewijs BI [+0,79, +3,26] sluit nul uit, robuust over schatters); een verkeerd uitgelijnde beperking is actief schadelijk, niet alleen nutteloos. Ten tweede komt een augmentatiebasislijn uitgerust met baangemiddelde bij testtijd exact overeen met het equivariante model – bit-identieke validatiecurven per epoch over gematchte cellen – dus de kloof tussen architectuur en augmentatie is conditioneel op asymmetrische testtijdberekening, niet onvoorwaardelijk. Ten derde is de relatieve uitwisselingsratio beta_diff = 1,28 consistent qua teken en grootteorde met de theoretische 1,0 (enkelvoudig BI [+0,92, +2,05]); de meer conservatieve tweeledige bootstrap (zaden x groepsgroottes) verbreedt dit naar [-0,63, +1,72], inclusief nul, en een fijnere N-replicatie op een sqrt(2)-gespreid raster is niet overtuigend (puntschatting -0,82). De methodologische bijdragen – de relatieve-snelheidsschatter die de gedeelde-moeilijkheidverstorende factor annuleert, de verkeerde-groepcontrole en een vooraf gespecificeerde faaltaxonomie – zijn overdraagbaar naar elke inductieve bias waarvan de sterkte kan worden geparametriseerd. Eerlijke afbakening: de primaire schatter beta_diff werd post-hoc aangenomen nadat de eerste analyse een identificatieprobleem met positieve helling onthulde; het ontwerp is nooit extern vooraf geregistreerd; en het kerncijfer berust op een OLS-helling over zeven groepsgroottes op een grof N-raster. Dit is een verkennende studie, geen bevestigende meting; het verkeerde-groepresultaat is de zuiverste bevinding en degene waarover we het meest zeker rapporteren. Een geregistreerde replicatie op verse zaden is toekomstig werk.

English

Equivariance theory predicts that an architectural symmetry prior reduces sample complexity by a factor of |G|; this is widely cited but rarely measured as a scaling law with controls that separate the prior from its confounds. On a controlled C_n-symmetric task, we report three findings. First, a wrong-group control with identical orbit size and matched compute is worse than no constraint (joint pairwise CI [+0.79, +3.26] excludes zero, robust across estimators); misaligned constraint is actively harmful, not merely unhelpful. Second, an augmentation baseline equipped with test-time orbit averaging matches the equivariant model exactly -- bit-identical per-epoch validation curves across matched cells -- so the architecture-vs-augmentation gap is conditional on asymmetric test-time computation, not unconditional. Third, the relative exchange rate beta_diff = 1.28 is consistent in sign and order of magnitude with the theoretical 1.0 (single-level CI [+0.92, +2.05]); the more conservative two-level bootstrap (seeds x group sizes) widens this to [-0.63, +1.72], including zero, and a finer-N replication on a sqrt(2)-spaced grid is inconclusive (point estimate -0.82). The methodological contributions -- the relative-rate estimator that cancels the shared-difficulty confound, the wrong-group control, and a pre-specified failure taxonomy -- transfer to any inductive bias whose strength can be parameterised. Honest scoping: the primary estimator beta_diff was adopted post-hoc after the initial analysis revealed a positive-slope identifiability problem; the design was never externally pre-registered; and the headline number rests on an OLS slope over seven group sizes on a coarse N grid. This is an exploratory study, not a confirmatory measurement; the wrong-group result is the cleanest finding and the one we report with the most confidence. A registered replication on fresh seeds is future work.