ReLMXEL: Controllore di Memoria Adattivo Basato su RL con Ottimizzazione Spiegabile di Energia e Latenza
ReLMXEL: Adaptive RL-Based Memory Controller with Explainable Energy and Latency Optimization
March 18, 2026
Autori: Panuganti Chirag Sai, Gandholi Sarat, R. Raghunatha Sarma, Venkata Kalyan Tavva, Naveen M
cs.AI
Abstract
La riduzione della latenza e del consumo energetico è fondamentale per migliorare l'efficienza dei sistemi di memoria nell'informatica moderna. Questo lavoro introduce ReLMXEL (Reinforcement Learning for Memory Controller with Explainable Energy and Latency Optimization), un framework spiegabile di apprendimento per rinforzo multi-agente online che ottimizza dinamicamente i parametri del controller di memoria utilizzando la scomposizione della ricompensa. ReLMXEL opera all'interno del controller di memoria, sfruttando metriche dettagliate del comportamento della memoria per guidare il processo decisionale. Le valutazioni sperimentali su diversi carichi di lavoro dimostrano miglioramenti prestazionali costanti rispetto alle configurazioni baseline, con perfezionamenti guidati dal comportamento specifico degli accessi alla memoria. Incorporando la spiegabilità nel processo di apprendimento, ReLMXEL non solo migliora le prestazioni ma aumenta anche la trasparenza delle decisioni di controllo, aprendo la strada a progetti di sistemi di memoria più responsivi e adattativi.
English
Reducing latency and energy consumption is critical to improving the efficiency of memory systems in modern computing. This work introduces ReLMXEL (Reinforcement Learning for Memory Controller with Explainable Energy and Latency Optimization), a explainable multi-agent online reinforcement learning framework that dynamically optimizes memory controller parameters using reward decomposition. ReLMXEL operates within the memory controller, leveraging detailed memory behavior metrics to guide decision-making. Experimental evaluations across diverse workloads demonstrate consistent performance gains over baseline configurations, with refinements driven by workload-specific memory access behaviour. By incorporating explainability into the learning process, ReLMXEL not only enhances performance but also increases the transparency of control decisions, paving the way for more accountable and adaptive memory system designs.