ChatPaper.aiChatPaper

小次元行列の高速乗算法:オープンソースフリップグラフフレームワークによる新方式の発見

Fast Matrix Multiplication in Small Formats: Discovering New Schemes with an Open-Source Flip Graph Framework

March 2, 2026
著者: A. I. Perminov
cs.AI

要旨

フリップグラフアプローチを用いた高速行列乗算スキーム発見のためのオープンソースC++フレームワークを提案する。本フレームワークは、二進数(Z_2)、剰余三進数(Z_3)、整数三進数(Z_T = {-1,0,1})という複数の係数環をサポートし、固定次元およびメタ次元の探索演算子を実装する。係数ベクトルの効率的なビットレベル符号化とOpenMP並列処理により、市販のハードウェアで大規模探索を可能にする。本研究では(2×2×2)から(16×16×16)に至る680のスキームを網羅し、うち276スキームがZ_T係数、117スキームが整数係数で実現された。本フレームワークにより、79の行列乗算スキームで乗算計算量(ランク)が改善された。特に、乗算回数115回の新規4×4×10スキームを発見し、ω≈2.80478を達成、このサイズにおいてシュトラッセンの指数を上回った。加えて、従来有理数または整数係数でのみ知られていた93の三進数係数スキーム、および分数を必要としていた68の整数係数スキームを再発見した。再現可能な研究を促進するため、全てのツール及び発見されたスキームを公開する。
English
An open-source C++ framework for discovering fast matrix multiplication schemes using the flip graph approach is presented. The framework supports multiple coefficient rings -- binary (Z_2), modular ternary (Z_3) and integer ternary (Z_T = {-1,0,1}) -- and implements both fixed-dimension and meta-dimensional search operators. Using efficient bit-level encoding of coefficient vectors and OpenMP parallelism, the tools enable large-scale exploration on commodity hardware. The study covers 680 schemes ranging from (2 times 2 times 2) to (16 times 16 times 16), with 276 schemes now in Z_T coefficients and 117 in integer coefficients. With this framework, the multiplicative complexity (rank) is improved for 79 matrix multiplication schemes. Notably, a new 4 times 4 times 10 scheme requiring only 115 multiplications is discovered, achieving ωapprox 2.80478 and beating Strassen's exponent for this specific size. Additionally, 93 schemes are rediscovered in ternary coefficients that were previously known only over rationals or integers, and 68 schemes in integer coefficients that previously required fractions. All tools and discovered schemes are made publicly available to enable reproducible research.
PDF12May 8, 2026