ChatPaper.aiChatPaper

Multiplicação Rápida de Matrizes em Formatos Pequenos: Descobrindo Novos Esquemas com uma Estrutura de Grafo de Inversão de Código Aberto

Fast Matrix Multiplication in Small Formats: Discovering New Schemes with an Open-Source Flip Graph Framework

March 2, 2026
Autores: A. I. Perminov
cs.AI

Resumo

Apresenta-se um framework de código aberto em C++ para descobrir esquemas rápidos de multiplicação de matrizes utilizando a abordagem do grafo de inversão. O framework suporta múltiplos anéis de coeficientes — binário (Z_2), ternário modular (Z_3) e ternário inteiro (Z_T = {-1,0,1}) — e implementa operadores de busca de dimensão fixa e meta-dimensional. Utilizando uma codificação eficiente a nível de *bits* para vetores de coeficientes e paralelismo OpenMP, as ferramentas permitem uma exploração em larga escala em hardware convencional. O estudo abrange 680 esquemas, variando de (2 x 2 x 2) a (16 x 16 x 16), sendo 276 esquemas agora com coeficientes em Z_T e 117 com coeficientes inteiros. Com este *framework*, a complexidade multiplicativa (*rank*) é melhorada para 79 esquemas de multiplicação de matrizes. Destaca-se a descoberta de um novo esquema 4 x 4 x 10 que requer apenas 115 multiplicações, alcançando ω ≈ 2,80478 e superando o expoente de Strassen para este tamanho específico. Adicionalmente, redescobriram-se 93 esquemas em coeficientes ternários que eram previamente conhecidos apenas sobre os racionais ou inteiros, e 68 esquemas em coeficientes inteiros que anteriormente requeriam frações. Todas as ferramentas e esquemas descobertos são disponibilizados publicamente para permitir pesquisa reproduzível.
English
An open-source C++ framework for discovering fast matrix multiplication schemes using the flip graph approach is presented. The framework supports multiple coefficient rings -- binary (Z_2), modular ternary (Z_3) and integer ternary (Z_T = {-1,0,1}) -- and implements both fixed-dimension and meta-dimensional search operators. Using efficient bit-level encoding of coefficient vectors and OpenMP parallelism, the tools enable large-scale exploration on commodity hardware. The study covers 680 schemes ranging from (2 times 2 times 2) to (16 times 16 times 16), with 276 schemes now in Z_T coefficients and 117 in integer coefficients. With this framework, the multiplicative complexity (rank) is improved for 79 matrix multiplication schemes. Notably, a new 4 times 4 times 10 scheme requiring only 115 multiplications is discovered, achieving ωapprox 2.80478 and beating Strassen's exponent for this specific size. Additionally, 93 schemes are rediscovered in ternary coefficients that were previously known only over rationals or integers, and 68 schemes in integer coefficients that previously required fractions. All tools and discovered schemes are made publicly available to enable reproducible research.
PDF02March 7, 2026