ChatPaper.aiChatPaper

Multiplication matricielle rapide dans les petits formats : Découverte de nouveaux schémas grâce à un framework open source de graphes de retournement

Fast Matrix Multiplication in Small Formats: Discovering New Schemes with an Open-Source Flip Graph Framework

March 2, 2026
Auteurs: A. I. Perminov
cs.AI

Résumé

Nous présentons un framework open-source en C++ pour découvrir des schémas de multiplication matricielle rapide par l'approche du graphe de retournement. Le framework prend en charge plusieurs anneaux de coefficients — binaire (Z₂), ternaire modulaire (Z₃) et ternaire entier (Z_T = {-1,0,1}) — et implémente des opérateurs de recherche à dimension fixe et méta-dimensionnelle. Grâce à un codage efficace des vecteurs de coefficients au niveau bit et au parallélisme OpenMP, les outils permettent une exploration à grande échelle sur du matériel standard. L'étude couvre 680 schémas allant de (2×2×2) à (16×16×16), dont 276 utilisent désormais des coefficients Z_T et 117 des coefficients entiers. Avec ce framework, la complexité multiplicative (rang) est améliorée pour 79 schémas de multiplication matricielle. Notamment, un nouveau schéma 4×4×10 nécessitant seulement 115 multiplications est découvert, atteignant ω ≈ 2,80478 et surpassant l'exposant de Strassen pour cette taille spécifique. De plus, 93 schémas sont redécouverts en coefficients ternaires qui n'étaient auparavant connus que sur les rationnels ou les entiers, et 68 schémas en coefficients entiers qui nécessitaient auparavant des fractions. Tous les outils et schémas découverts sont mis à disposition publique pour permettre une recherche reproductible.
English
An open-source C++ framework for discovering fast matrix multiplication schemes using the flip graph approach is presented. The framework supports multiple coefficient rings -- binary (Z_2), modular ternary (Z_3) and integer ternary (Z_T = {-1,0,1}) -- and implements both fixed-dimension and meta-dimensional search operators. Using efficient bit-level encoding of coefficient vectors and OpenMP parallelism, the tools enable large-scale exploration on commodity hardware. The study covers 680 schemes ranging from (2 times 2 times 2) to (16 times 16 times 16), with 276 schemes now in Z_T coefficients and 117 in integer coefficients. With this framework, the multiplicative complexity (rank) is improved for 79 matrix multiplication schemes. Notably, a new 4 times 4 times 10 scheme requiring only 115 multiplications is discovered, achieving ωapprox 2.80478 and beating Strassen's exponent for this specific size. Additionally, 93 schemes are rediscovered in ternary coefficients that were previously known only over rationals or integers, and 68 schemes in integer coefficients that previously required fractions. All tools and discovered schemes are made publicly available to enable reproducible research.
PDF12May 8, 2026