ChatPaper.aiChatPaper

Moltiplicazione Matrice Veloce in Formati Ridotti: Scoperta di Nuovi Schemi con un Framework Open-Source a Grafo di Ribaltamento

Fast Matrix Multiplication in Small Formats: Discovering New Schemes with an Open-Source Flip Graph Framework

March 2, 2026
Autori: A. I. Perminov
cs.AI

Abstract

Viene presentato un framework open-source in C++ per la scoperta di schemi di moltiplicazione matriciale veloce mediante l'approccio del grafo di inversione (flip graph). Il framework supporta molteplici anelli di coefficienti — binario (Z_2), ternario modulare (Z_3) e ternario intero (Z_T = {-1,0,1}) — e implementa operatori di ricerca sia a dimensione fissa che meta-dimensionali. Utilizzando una codifica efficiente a livello di bit per i vettori di coefficienti e il parallelismo OpenMP, gli strumenti consentono un'esplorazione su larga scala su hardware commerciale. Lo studio copre 680 schemi che vanno da (2×2×2) a (16×16×16), con 276 schemi ora in coefficienti Z_T e 117 in coefficienti interi. Con questo framework, la complessità moltiplicativa (rango) è stata migliorata per 79 schemi di moltiplicazione matriciale. In particolare, è stato scoperto un nuovo schema 4×4×10 che richiede solo 115 moltiplicazioni, raggiungendo ω≈2.80478 e superando l'esponente di Strassen per questa dimensione specifica. Inoltre, sono stati riscoperti 93 schemi in coefficienti ternari che erano precedentemente noti solo per i razionali o gli interi, e 68 schemi in coefficienti interi che precedentemente richiedevano l'uso di frazioni. Tutti gli strumenti e gli schemi scoperti sono resi pubblicamente disponibili per consentire una ricerca riproducibile.
English
An open-source C++ framework for discovering fast matrix multiplication schemes using the flip graph approach is presented. The framework supports multiple coefficient rings -- binary (Z_2), modular ternary (Z_3) and integer ternary (Z_T = {-1,0,1}) -- and implements both fixed-dimension and meta-dimensional search operators. Using efficient bit-level encoding of coefficient vectors and OpenMP parallelism, the tools enable large-scale exploration on commodity hardware. The study covers 680 schemes ranging from (2 times 2 times 2) to (16 times 16 times 16), with 276 schemes now in Z_T coefficients and 117 in integer coefficients. With this framework, the multiplicative complexity (rank) is improved for 79 matrix multiplication schemes. Notably, a new 4 times 4 times 10 scheme requiring only 115 multiplications is discovered, achieving ωapprox 2.80478 and beating Strassen's exponent for this specific size. Additionally, 93 schemes are rediscovered in ternary coefficients that were previously known only over rationals or integers, and 68 schemes in integer coefficients that previously required fractions. All tools and discovered schemes are made publicly available to enable reproducible research.
PDF02March 7, 2026