ReLMXEL: Controlador de Memória Adaptativo Baseado em RL com Otimização Explicável de Energia e Latência

Resumo

A redução da latência e do consumo de energia é crítica para melhorar a eficiência dos sistemas de memória na computação moderna. Este trabalho introduz o ReLMXEL (Reinforcement Learning for Memory Controller with Explainable Energy and Latency Optimization), uma estrutura explicável de aprendizagem por reforço online multiagente que otimiza dinamicamente os parâmetros do controlador de memória usando decomposição de recompensa. O ReLMXEL opera dentro do controlador de memória, aproveitando métricas detalhadas do comportamento da memória para orientar a tomada de decisão. Avaliações experimentais em diversas cargas de trabalho demonstram ganhos de desempenho consistentes em relação a configurações de base, com refinamentos orientados pelo comportamento específico de acesso à memória de cada carga. Ao incorporar a explicabilidade no processo de aprendizagem, o ReLMXEL não apenas melhora o desempenho, mas também aumenta a transparência das decisões de controlo, abrindo caminho para projetos de sistemas de memória mais responsáveis e adaptativos.

English

Reducing latency and energy consumption is critical to improving the efficiency of memory systems in modern computing. This work introduces ReLMXEL (Reinforcement Learning for Memory Controller with Explainable Energy and Latency Optimization), a explainable multi-agent online reinforcement learning framework that dynamically optimizes memory controller parameters using reward decomposition. ReLMXEL operates within the memory controller, leveraging detailed memory behavior metrics to guide decision-making. Experimental evaluations across diverse workloads demonstrate consistent performance gains over baseline configurations, with refinements driven by workload-specific memory access behaviour. By incorporating explainability into the learning process, ReLMXEL not only enhances performance but also increases the transparency of control decisions, paving the way for more accountable and adaptive memory system designs.