ChatPaper.aiChatPaper

Быстрое умножение матриц в малых форматах: открытие новых схем с помощью фреймворка с открытым исходным кодом на основе графа переключений

Fast Matrix Multiplication in Small Formats: Discovering New Schemes with an Open-Source Flip Graph Framework

March 2, 2026
Авторы: A. I. Perminov
cs.AI

Аннотация

Представлен фреймворк с открытым исходным кодом на C++ для поиска быстрых алгоритмов умножения матриц с использованием подхода на основе графа переворотов. Фреймворк поддерживает несколько колец коэффициентов — бинарное (Z₂), модульное троичное (Z₃) и целочисленное троичное (Z_T = {-1,0,1}) — и реализует операторы поиска как для фиксированной размерности, так и для мета-размерности. Благодаря эффективному битовому кодированию векторов коэффициентов и параллелизму на основе OpenMP, инструменты позволяют проводить масштабные исследования на стандартном оборудовании. В исследовании рассмотрено 680 алгоритмов размером от (2×2×2) до (16×16×16), из которых 276 алгоритмов используют коэффициенты Z_T, а 117 — целочисленные коэффициенты. С помощью данного фреймворка удалось улучшить мультипликативную сложность (ранг) для 79 алгоритмов умножения матриц. В частности, обнаружен новый алгоритм 4×4×10, требующий всего 115 умножений, который достигает ω ≈ 2,80478 и превосходит показатель Строссена для данного размера. Кроме того, заново открыты 93 алгоритма в троичных коэффициентах, которые ранее были известны только для рациональных или целых чисел, и 68 алгоритмов в целочисленных коэффициентах, которые ранее требовали дробей. Все инструменты и обнаруженные алгоритмы находятся в открытом доступе для обеспечения воспроизводимости исследований.
English
An open-source C++ framework for discovering fast matrix multiplication schemes using the flip graph approach is presented. The framework supports multiple coefficient rings -- binary (Z_2), modular ternary (Z_3) and integer ternary (Z_T = {-1,0,1}) -- and implements both fixed-dimension and meta-dimensional search operators. Using efficient bit-level encoding of coefficient vectors and OpenMP parallelism, the tools enable large-scale exploration on commodity hardware. The study covers 680 schemes ranging from (2 times 2 times 2) to (16 times 16 times 16), with 276 schemes now in Z_T coefficients and 117 in integer coefficients. With this framework, the multiplicative complexity (rank) is improved for 79 matrix multiplication schemes. Notably, a new 4 times 4 times 10 scheme requiring only 115 multiplications is discovered, achieving ωapprox 2.80478 and beating Strassen's exponent for this specific size. Additionally, 93 schemes are rediscovered in ternary coefficients that were previously known only over rationals or integers, and 68 schemes in integer coefficients that previously required fractions. All tools and discovered schemes are made publicly available to enable reproducible research.
PDF12May 8, 2026