ChatPaper.aiChatPaper

Multiplicación Rápida de Matrices en Formatos Pequeños: Descubriendo Nuevos Esquemas con un Marco de Grafo de Volteretas de Código Abierto

Fast Matrix Multiplication in Small Formats: Discovering New Schemes with an Open-Source Flip Graph Framework

March 2, 2026
Autores: A. I. Perminov
cs.AI

Resumen

Se presenta un framework de código abierto en C++ para descubrir esquemas rápidos de multiplicación de matrices utilizando el enfoque del grafo de inversión. El framework admite múltiples anillos de coeficientes — binario (Z_2), ternario modular (Z_3) y ternario entero (Z_T = {-1,0,1}) — e implementa operadores de búsqueda de dimensión fija y meta-dimensional. Utilizando una codificación eficiente a nivel de bits para los vectores de coeficientes y paralelismo OpenMP, las herramientas permiten una exploración a gran escala en hardware estándar. El estudio abarca 680 esquemas que van desde (2 × 2 × 2) hasta (16 × 16 × 16), con 276 esquemas ahora en coeficientes Z_T y 117 en coeficientes enteros. Con este framework, se mejora la complejidad multiplicativa (rango) para 79 esquemas de multiplicación de matrices. Destaca el descubrimiento de un nuevo esquema 4 × 4 × 10 que requiere solo 115 multiplicaciones, logrando ω ≈ 2.80478 y superando el exponente de Strassen para este tamaño específico. Adicionalmente, se redescubren 93 esquemas en coeficientes ternarios que solo se conocían previamente sobre racionales o enteros, y 68 esquemas en coeficientes enteros que antes requerían fracciones. Todas las herramientas y esquemas descubiertos se ponen a disposición pública para permitir una investigación reproducible.
English
An open-source C++ framework for discovering fast matrix multiplication schemes using the flip graph approach is presented. The framework supports multiple coefficient rings -- binary (Z_2), modular ternary (Z_3) and integer ternary (Z_T = {-1,0,1}) -- and implements both fixed-dimension and meta-dimensional search operators. Using efficient bit-level encoding of coefficient vectors and OpenMP parallelism, the tools enable large-scale exploration on commodity hardware. The study covers 680 schemes ranging from (2 times 2 times 2) to (16 times 16 times 16), with 276 schemes now in Z_T coefficients and 117 in integer coefficients. With this framework, the multiplicative complexity (rank) is improved for 79 matrix multiplication schemes. Notably, a new 4 times 4 times 10 scheme requiring only 115 multiplications is discovered, achieving ωapprox 2.80478 and beating Strassen's exponent for this specific size. Additionally, 93 schemes are rediscovered in ternary coefficients that were previously known only over rationals or integers, and 68 schemes in integer coefficients that previously required fractions. All tools and discovered schemes are made publicly available to enable reproducible research.
PDF12May 8, 2026