ReLMXEL: Controlador de Memoria Adaptativo Basado en RL con Optimización Explicable de Energía y Latencia
ReLMXEL: Adaptive RL-Based Memory Controller with Explainable Energy and Latency Optimization
March 18, 2026
Autores: Panuganti Chirag Sai, Gandholi Sarat, R. Raghunatha Sarma, Venkata Kalyan Tavva, Naveen M
cs.AI
Resumen
La reducción de la latencia y el consumo de energía es fundamental para mejorar la eficiencia de los sistemas de memoria en la computación moderna. Este trabajo presenta ReLMXEL (Aprendizaje por Refuerzo para Controladores de Memoria con Optimización Explicable de Energía y Latencia), un marco explicable de aprendizaje por refuerzo en línea multiagente que optimiza dinámicamente los parámetros del controlador de memoria mediante descomposición de recompensas. ReLMXEL opera dentro del controlador de memoria, aprovechando métricas detalladas del comportamiento de la memoria para guiar la toma de decisiones. Las evaluaciones experimentales en diversas cargas de trabajo demuestran mejoras de rendimiento consistentes respecto a las configuraciones base, con refinamientos impulsados por el comportamiento específico de acceso a memoria según la carga de trabajo. Al incorporar explicabilidad en el proceso de aprendizaje, ReLMXEL no solo mejora el rendimiento sino que también aumenta la transparencia de las decisiones de control, allanando el camino para diseños de sistemas de memoria más responsables y adaptativos.
English
Reducing latency and energy consumption is critical to improving the efficiency of memory systems in modern computing. This work introduces ReLMXEL (Reinforcement Learning for Memory Controller with Explainable Energy and Latency Optimization), a explainable multi-agent online reinforcement learning framework that dynamically optimizes memory controller parameters using reward decomposition. ReLMXEL operates within the memory controller, leveraging detailed memory behavior metrics to guide decision-making. Experimental evaluations across diverse workloads demonstrate consistent performance gains over baseline configurations, with refinements driven by workload-specific memory access behaviour. By incorporating explainability into the learning process, ReLMXEL not only enhances performance but also increases the transparency of control decisions, paving the way for more accountable and adaptive memory system designs.