ChatPaper.aiChatPaper

소형 형식에서의 고속 행렬 곱셈: 오픈소스 플립 그래프 프레임워크를 이용한 새로운 기법 탐구

Fast Matrix Multiplication in Small Formats: Discovering New Schemes with an Open-Source Flip Graph Framework

March 2, 2026
저자: A. I. Perminov
cs.AI

초록

플립 그래프 접근법을 활용한 고속 행렬 곱셈 방식 탐색을 위한 오픈소스 C++ 프레임워크를 소개한다. 본 프레임워크는 이진(Z_2), 모듈러 3진(Z_3), 정수 3진(Z_T = {-1,0,1}) 등 다양한 계수 환을 지원하며, 고정 차원 및 메타 차원 탐색 연산자를 모두 구현한다. 계수 벡터의 효율적인 비트 수준 인코딩과 OpenMP 병렬 처리를 통해 일반 상용 하드웨어에서 대규모 탐색이 가능하다. 본 연구는 (2×2×2)부터 (16×16×16)까지 총 680가지 방식을 다루며, 그중 276개는 Z_T 계수에서, 117개는 정수 계수에서 새롭게 제시된다. 이 프레임워크를 통해 79개 행렬 곱셈 방식의 곱셈 복잡도(랭크)가 개선되었다. 특히, 115회의 곱셈만 필요한 새로운 4×4×10 방식이 발견되어 ω ≈ 2.80478을 달성하며, 해당 크기에서 슈트라센의 지수를 능가하였다. 추가적으로, 유리수나 정수 계수에서만 알려졌던 93개의 3진 계수 방식과 분수가 필요했던 68개의 정수 계수 방식을 재발견하였다. 재현 가능한 연구를 위해 모든 도구와 발견된 방식은 공개되었다.
English
An open-source C++ framework for discovering fast matrix multiplication schemes using the flip graph approach is presented. The framework supports multiple coefficient rings -- binary (Z_2), modular ternary (Z_3) and integer ternary (Z_T = {-1,0,1}) -- and implements both fixed-dimension and meta-dimensional search operators. Using efficient bit-level encoding of coefficient vectors and OpenMP parallelism, the tools enable large-scale exploration on commodity hardware. The study covers 680 schemes ranging from (2 times 2 times 2) to (16 times 16 times 16), with 276 schemes now in Z_T coefficients and 117 in integer coefficients. With this framework, the multiplicative complexity (rank) is improved for 79 matrix multiplication schemes. Notably, a new 4 times 4 times 10 scheme requiring only 115 multiplications is discovered, achieving ωapprox 2.80478 and beating Strassen's exponent for this specific size. Additionally, 93 schemes are rediscovered in ternary coefficients that were previously known only over rationals or integers, and 68 schemes in integer coefficients that previously required fractions. All tools and discovered schemes are made publicly available to enable reproducible research.
PDF12May 8, 2026