Schnelle Matrixmultiplikation in kleinen Formaten: Entdeckung neuer Verfahren mit einem Open-Source-Flip-Graph-Framework
Fast Matrix Multiplication in Small Formats: Discovering New Schemes with an Open-Source Flip Graph Framework
March 2, 2026
Autoren: A. I. Perminov
cs.AI
Zusammenfassung
Es wird ein quelloffenes C++-Framework zur Entdeckung schneller Matrixmultiplikationsschemata mittels des Flip-Graphen-Ansatzes vorgestellt. Das Framework unterstützt mehrere Koeffizientenringe – binär (Z₂), modular ternär (Z₃) und ganzzahlig ternär (Z_T = {-1,0,1}) – und implementiert sowohl suchoperatoren für feste Dimensionen als auch metadimensionale Suchoperatoren. Durch effiziente Bit-Ebene-Kodierung von Koeffizientenvektoren und OpenMP-Parallelisierung ermöglichen die Werkzeuge eine großflächige Exploration auf handelsüblicher Hardware. Die Studie umfasst 680 Schemata von (2×2×2) bis (16×16×16), wovon 276 Schemata nun in Z_T-Koeffizienten und 117 in ganzzahligen Koeffizienten vorliegen. Mit diesem Framework wird die multiplikative Komplexität (Rang) für 79 Matrixmultiplikationsschemata verbessert. Bemerkenswerterweise wird ein neues 4×4×10-Schema entdeckt, das nur 115 Multiplikationen erfordert, ω ≈ 2,80478 erreicht und damit den Strassen-Exponenten für diese spezifische Größe übertrifft. Zusätzlich werden 93 Schemata in ternären Koeffizienten wiederentdeckt, die zuvor nur über den rationalen oder ganzen Zahlen bekannt waren, sowie 68 Schemata in ganzzahligen Koeffizienten, die zuvor Brüche erforderten. Alle Werkzeuge und entdeckten Schemata sind öffentlich verfügbar, um reproduzierbare Forschung zu ermöglichen.
English
An open-source C++ framework for discovering fast matrix multiplication schemes using the flip graph approach is presented. The framework supports multiple coefficient rings -- binary (Z_2), modular ternary (Z_3) and integer ternary (Z_T = {-1,0,1}) -- and implements both fixed-dimension and meta-dimensional search operators. Using efficient bit-level encoding of coefficient vectors and OpenMP parallelism, the tools enable large-scale exploration on commodity hardware. The study covers 680 schemes ranging from (2 times 2 times 2) to (16 times 16 times 16), with 276 schemes now in Z_T coefficients and 117 in integer coefficients. With this framework, the multiplicative complexity (rank) is improved for 79 matrix multiplication schemes. Notably, a new 4 times 4 times 10 scheme requiring only 115 multiplications is discovered, achieving ωapprox 2.80478 and beating Strassen's exponent for this specific size. Additionally, 93 schemes are rediscovered in ternary coefficients that were previously known only over rationals or integers, and 68 schemes in integer coefficients that previously required fractions. All tools and discovered schemes are made publicly available to enable reproducible research.