クラスタワークロード割り当て:自然言語処理を用いた意味的ソフトアフィニティ
Cluster Workload Allocation: Semantic Soft Affinity Using Natural Language Processing
January 14, 2026
著者: Leszek Sliwko, Jolanta Mizeria-Pietraszko
cs.AI
要旨
クラスタワークロード割り当てには、複雑な設定がしばしば必要となり、ユーザビリティの課題が生じている。本論文は、自然言語処理を用いた、意味論的かつ意図駆動型のクラスタシステム向けスケジューリングパラダイムを提案する。本システムは、Kubernetesスケジューラエクステンダーを介して統合された大規模言語モデルを利用し、ソフトアフィニティ設定における自然言語による割り当てヒントアノテーションを解釈する。クラスタ状態キャッシュと意図分析器(AWS Bedrock使用)を備えたプロトタイプを開発した。実証評価では、Amazon Nova Pro/PremierやMistral Pixtral Largeなどの高精度モデルにおいて、評価用正解データセットに対するLLMの解析精度が高く(サブセット精度>95%)、ベースラインエンジンを大幅に上回った。6つのシナリオにおけるスケジューリング品質テストでは、プロトタイプが標準的なKubernetes設定と比較して同等以上の配置を達成し、特に複雑で定量的なシナリオおよび競合するソフト設定の処理において優れた性能を示した。この結果は、LLMを利用したアクセスしやすいスケジューリングの有効性を実証する一方、同期型LLM呼び出しのレイテンシといった課題も明らかとなり、本番環境での利用には非同期処理の必要性が示唆された。本研究は、ワークロードオーケストレーションを簡素化する意味論的ソフトアフィニティの実現可能性を確認するものである。
English
Cluster workload allocation often requires complex configurations, creating a usability gap. This paper introduces a semantic, intent-driven scheduling paradigm for cluster systems using Natural Language Processing. The system employs a Large Language Model (LLM) integrated via a Kubernetes scheduler extender to interpret natural language allocation hint annotations for soft affinity preferences. A prototype featuring a cluster state cache and an intent analyzer (using AWS Bedrock) was developed. Empirical evaluation demonstrated high LLM parsing accuracy (>95% Subset Accuracy on an evaluation ground-truth dataset) for top-tier models like Amazon Nova Pro/Premier and Mistral Pixtral Large, significantly outperforming a baseline engine. Scheduling quality tests across six scenarios showed the prototype achieved superior or equivalent placement compared to standard Kubernetes configurations, particularly excelling in complex and quantitative scenarios and handling conflicting soft preferences. The results validate using LLMs for accessible scheduling but highlight limitations like synchronous LLM latency, suggesting asynchronous processing for production readiness. This work confirms the viability of semantic soft affinity for simplifying workload orchestration.