大規模言語モデル時代における自動カーネル生成の実現に向けて
Towards Automated Kernel Generation in the Era of LLMs
January 22, 2026
著者: Yang Yu, Peiyu Zang, Chi Hsu Tsai, Haiming Wu, Yixin Shen, Jialing Zhang, Haoyu Wang, Zhiyou Xiao, Jingze Shi, Yuyu Luo, Wentao Zhang, Chunlei Men, Guang Liu, Yonghua Lin
cs.AI
要旨
現代AIシステムの性能は、高水準のアルゴリズム的意味論を低水準のハードウェア操作に変換する基盤カーネルの質によって根本的に制約されている。ほぼ最適なカーネルを達成するには、ハードウェアアーキテクチャとプログラミングモデルに関する専門家レベルの理解が必要であり、カーネルエンジニアリングは極めて重要ながら、非常に時間がかかりスケーラブルでないプロセスとなっている。大規模言語モデル(LLM)およびLLMベースのエージェントにおける最近の進展は、カーネル生成と最適化の自動化に新たな可能性をもたらした。LLMは形式化が困難な専門家レベルのカーネル知識を圧縮するのに適しており、エージェントシステムはカーネル開発を反復的でフィードバック駆動型のループとして位置づけることで、さらにスケーラブルな最適化を可能にする。この分野では急速な進展が見られている。しかし、この分野は依然として断片的であり、LLM駆動のカーネル生成に対する体系的な視点を欠いている。本調査は、このギャップに応えるため、LLMベースのアプローチとエージェント型最適化ワークフローにわたる既存手法の構造的な概観を提供し、この領域における学習と評価を支えるデータセットおよびベンチマークを体系的にまとめる。さらに、主要な未解決課題と将来の研究方向性を提示し、次世代の自動化カーネル最適化のための包括的な参照基準の確立を目指す。この分野の動向を追跡するため、オープンソースのGitHubリポジトリをhttps://github.com/flagos-ai/awesome-LLM-driven-kernel-generation にて維持している。
English
The performance of modern AI systems is fundamentally constrained by the quality of their underlying kernels, which translate high-level algorithmic semantics into low-level hardware operations. Achieving near-optimal kernels requires expert-level understanding of hardware architectures and programming models, making kernel engineering a critical but notoriously time-consuming and non-scalable process. Recent advances in large language models (LLMs) and LLM-based agents have opened new possibilities for automating kernel generation and optimization. LLMs are well-suited to compress expert-level kernel knowledge that is difficult to formalize, while agentic systems further enable scalable optimization by casting kernel development as an iterative, feedback-driven loop. Rapid progress has been made in this area. However, the field remains fragmented, lacking a systematic perspective for LLM-driven kernel generation. This survey addresses this gap by providing a structured overview of existing approaches, spanning LLM-based approaches and agentic optimization workflows, and systematically compiling the datasets and benchmarks that underpin learning and evaluation in this domain. Moreover, key open challenges and future research directions are further outlined, aiming to establish a comprehensive reference for the next generation of automated kernel optimization. To keep track of this field, we maintain an open-source GitHub repository at https://github.com/flagos-ai/awesome-LLM-driven-kernel-generation.