ChatPaper.aiChatPaper

Snelle Matrixvermenigvuldiging in Kleine Formaten: Ontdekking van Nieuwe Schema's met een Open-Source Flip-Grafiekraamwerk

Fast Matrix Multiplication in Small Formats: Discovering New Schemes with an Open-Source Flip Graph Framework

March 2, 2026
Auteurs: A. I. Perminov
cs.AI

Samenvatting

Er wordt een open-source C++-framework gepresenteerd voor het ontdekken van snelle matrixvermenigvuldigingsschema's met behulp van de flip-grafiekbenadering. Het framework ondersteunt meerdere coëfficiëntenringen – binair (Z_2), modulair ternair (Z_3) en integer ternair (Z_T = {-1,0,1}) – en implementeert zowel zoekoperatoren voor vaste dimensies als meta-dimensionele zoekoperatoren. Door efficiënte bitgecodeerde representatie van coëfficiëntenvectoren en OpenMP-parallelisme maken de tools grootschalige exploratie op consumentenhardware mogelijk. De studie omvat 680 schema's, variërend van (2×2×2) tot (16×16×16), waarvan 276 schema's nu in Z_T-coëfficiënten en 117 in integercoëfficiënten. Met dit framework wordt de multiplicatieve complexiteit (rang) verbeterd voor 79 matrixvermenigvuldigingsschema's. Opmerkelijk is de ontdekking van een nieuw 4×4×10-schema dat slechts 115 vermenigvuldigingen vereist, wat resulteert in ω ≈ 2.80478 en daarmee Strassens exponent voor dit specifieke formaat overtreft. Bovendien worden 93 schema's herontdekt in ternaire coëfficiënten die voorheen alleen over rationale getallen of gehele getallen bekend waren, en 68 schema's in integercoëfficiënten die voorheen breuken vereisten. Alle tools en ontdekte schema's zijn publiekelijk beschikbaar gesteld om reproduceerbaar onderzoek mogelijk te maken.
English
An open-source C++ framework for discovering fast matrix multiplication schemes using the flip graph approach is presented. The framework supports multiple coefficient rings -- binary (Z_2), modular ternary (Z_3) and integer ternary (Z_T = {-1,0,1}) -- and implements both fixed-dimension and meta-dimensional search operators. Using efficient bit-level encoding of coefficient vectors and OpenMP parallelism, the tools enable large-scale exploration on commodity hardware. The study covers 680 schemes ranging from (2 times 2 times 2) to (16 times 16 times 16), with 276 schemes now in Z_T coefficients and 117 in integer coefficients. With this framework, the multiplicative complexity (rank) is improved for 79 matrix multiplication schemes. Notably, a new 4 times 4 times 10 scheme requiring only 115 multiplications is discovered, achieving ωapprox 2.80478 and beating Strassen's exponent for this specific size. Additionally, 93 schemes are rediscovered in ternary coefficients that were previously known only over rationals or integers, and 68 schemes in integer coefficients that previously required fractions. All tools and discovered schemes are made publicly available to enable reproducible research.
PDF02March 7, 2026