対称性の測定―データ交換レート
Measuring the Symmetry--Data Exchange Rate
May 31, 2026
著者: Ahmed M. Adly
cs.AI
要旨
等変性理論は、アーキテクチャの対称性事前分布がサンプル複雑性を|G|倍減少させることを予測する。この結果は広く引用されているが、その事前分布を交絡因子から分離する制御を伴うスケーリング則として測定されることはまれである。制御されたC_n対称タスクにおいて、我々は三つの知見を報告する。第一に、同一の軌道サイズと一致した計算量を持つ誤群制御は、制約なしよりも悪い結果をもたらす(結合ペアワイズCI [+0.79, +3.26] はゼロを除外し、推定手法間でロバスト)。不整合な制約は単に役に立たないだけでなく、積極的に有害である。第二に、テスト時の軌道平均化を備えたデータ拡張ベースラインは等変モデルと完全に一致する——一致したセル間でエポックごとの検証曲線がビット単位で一致する。したがって、アーキテクチャ対データ拡張のギャップは、非対称なテスト時計算に条件づけられており、無条件ではない。第三に、相対交換率beta_diff = 1.28は、符号とオーダーにおいて理論値1.0と一致する(単一レベルCI [+0.92, +2.05])。より保守的な二段階ブートストラップ(シード×グループサイズ)では、これが[-0.63, +1.72]に広がり、ゼロを含む。また、sqrt(2)間隔のグリッド上でのより細かいNの再現実験では、決定的でない(点推定値-0.82)。方法論的貢献——共有難易度交絡を打ち消す相対率推定器、誤群制御、および事前指定された失敗分類——は、強度をパラメータ化可能な任意の帰納的バイアスに転用可能である。正直なスコーピング:主要推定器beta_diffは、初期分析で正の傾きの識別可能性問題が明らかになった後、事後的に採用された。この設計は外部に事前登録されたものではなく、見出しの数値は粗いNグリッド上の七つのグループサイズに対するOLS傾きに依存している。これは探索的研究であり、確認的測定ではない。誤群の結果が最も明確な知見であり、我々が最も確信を持って報告するものである。新鮮なシードを用いた登録再現実験は今後の課題である。
English
Equivariance theory predicts that an architectural symmetry prior reduces sample complexity by a factor of |G|; this is widely cited but rarely measured as a scaling law with controls that separate the prior from its confounds. On a controlled C_n-symmetric task, we report three findings. First, a wrong-group control with identical orbit size and matched compute is worse than no constraint (joint pairwise CI [+0.79, +3.26] excludes zero, robust across estimators); misaligned constraint is actively harmful, not merely unhelpful. Second, an augmentation baseline equipped with test-time orbit averaging matches the equivariant model exactly -- bit-identical per-epoch validation curves across matched cells -- so the architecture-vs-augmentation gap is conditional on asymmetric test-time computation, not unconditional. Third, the relative exchange rate beta_diff = 1.28 is consistent in sign and order of magnitude with the theoretical 1.0 (single-level CI [+0.92, +2.05]); the more conservative two-level bootstrap (seeds x group sizes) widens this to [-0.63, +1.72], including zero, and a finer-N replication on a sqrt(2)-spaced grid is inconclusive (point estimate -0.82). The methodological contributions -- the relative-rate estimator that cancels the shared-difficulty confound, the wrong-group control, and a pre-specified failure taxonomy -- transfer to any inductive bias whose strength can be parameterised. Honest scoping: the primary estimator beta_diff was adopted post-hoc after the initial analysis revealed a positive-slope identifiability problem; the design was never externally pre-registered; and the headline number rests on an OLS slope over seven group sizes on a coarse N grid. This is an exploratory study, not a confirmatory measurement; the wrong-group result is the cleanest finding and the one we report with the most confidence. A registered replication on fresh seeds is future work.