ChatPaper.aiChatPaper

Medindo a Simetria – Taxa de Troca de Dados

Measuring the Symmetry--Data Exchange Rate

May 31, 2026
Autores: Ahmed M. Adly
cs.AI

Resumo

A teoria da equivariância prevê que um prior de simetria arquitetural reduz a complexidade amostral por um fator de |G|; isso é amplamente citado, mas raramente medido como uma lei de escala com controles que separem o prior de seus confundidores. Em uma tarefa controlada com simetria C_n, reportamos três descobertas. Primeiro, um controle de grupo errado com tamanho de órbita idêntico e computação equiparada é pior do que nenhuma restrição (IC pareado conjunto [+0,79, +3,26] exclui zero, robusto entre estimadores); uma restrição desalinhada é ativamente prejudicial, não apenas inútil. Segundo, uma linha de base de aumento equipada com média de órbita no teste corresponde exatamente ao modelo equivariante — curvas de validação por época bit a bit idênticas em células pareadas —, portanto, a lacuna arquitetura versus aumento é condicional à computação assimétrica no teste, não incondicional. Terceiro, a taxa de câmbio relativa beta_diff = 1,28 é consistente em sinal e ordem de grandeza com o valor teórico de 1,0 (IC de nível único [+0,92, +2,05]); o bootstrap mais conservador de dois níveis (sementes × tamanhos de grupo) amplia isso para [-0,63, +1,72], incluindo zero, e uma replicação com N mais fino em uma grade de espaçamento √2 é inconclusiva (estimativa pontual -0,82). As contribuições metodológicas — o estimador de taxa relativa que cancela o confundidor de dificuldade compartilhada, o controle de grupo errado e uma taxonomia de falhas pré-especificada — são transferíveis para qualquer viés indutivo cuja força possa ser parametrizada. Escopo honesto: o estimador primário beta_diff foi adotado post-hoc após a análise inicial revelar um problema de identificabilidade de inclinação positiva; o design nunca foi pré-registrado externamente; e o número principal depende de uma inclinação OLS sobre sete tamanhos de grupo em uma grade de N grosseira. Este é um estudo exploratório, não uma medição confirmatória; o resultado do grupo errado é a descoberta mais clara e aquela que reportamos com maior confiança. Uma replicação registrada com novas sementes é trabalho futuro.
English
Equivariance theory predicts that an architectural symmetry prior reduces sample complexity by a factor of |G|; this is widely cited but rarely measured as a scaling law with controls that separate the prior from its confounds. On a controlled C_n-symmetric task, we report three findings. First, a wrong-group control with identical orbit size and matched compute is worse than no constraint (joint pairwise CI [+0.79, +3.26] excludes zero, robust across estimators); misaligned constraint is actively harmful, not merely unhelpful. Second, an augmentation baseline equipped with test-time orbit averaging matches the equivariant model exactly -- bit-identical per-epoch validation curves across matched cells -- so the architecture-vs-augmentation gap is conditional on asymmetric test-time computation, not unconditional. Third, the relative exchange rate beta_diff = 1.28 is consistent in sign and order of magnitude with the theoretical 1.0 (single-level CI [+0.92, +2.05]); the more conservative two-level bootstrap (seeds x group sizes) widens this to [-0.63, +1.72], including zero, and a finer-N replication on a sqrt(2)-spaced grid is inconclusive (point estimate -0.82). The methodological contributions -- the relative-rate estimator that cancels the shared-difficulty confound, the wrong-group control, and a pre-specified failure taxonomy -- transfer to any inductive bias whose strength can be parameterised. Honest scoping: the primary estimator beta_diff was adopted post-hoc after the initial analysis revealed a positive-slope identifiability problem; the design was never externally pre-registered; and the headline number rests on an OLS slope over seven group sizes on a coarse N grid. This is an exploratory study, not a confirmatory measurement; the wrong-group result is the cleanest finding and the one we report with the most confidence. A registered replication on fresh seeds is future work.