ReLMXEL: Адаптивный контроллер памяти на основе обучения с подкреплением с объяснимой оптимизацией энергопотребления и задержек
ReLMXEL: Adaptive RL-Based Memory Controller with Explainable Energy and Latency Optimization
March 18, 2026
Авторы: Panuganti Chirag Sai, Gandholi Sarat, R. Raghunatha Sarma, Venkata Kalyan Tavva, Naveen M
cs.AI
Аннотация
Снижение задержки и энергопотребления является критически важным для повышения эффективности систем памяти в современных вычислительных устройствах. В данной работе представлен ReLMXEL (Обучение с подкреплением для контроллера памяти с объяснимой оптимизацией энергопотребления и задержек) — объяснимый многоагентный фреймворк онлайн-обучения с подкреплением, который динамически оптимизирует параметры контроллера памяти с использованием декомпозиции вознаграждения. ReLMXEL функционирует внутри контроллера памяти, используя детальные метрики поведения памяти для принятия решений. Экспериментальные оценки на различных рабочих нагрузках демонстрируют стабильное улучшение производительности по сравнению с базовыми конфигурациями, причем оптимизация обусловлена специфичным для нагрузки поведением при доступе к памяти. Благодаря включению объяснимости в процесс обучения, ReLMXEL не только повышает производительность, но и увеличивает прозрачность управляющих решений, открывая путь к созданию более ответственных и адаптивных проектов систем памяти.
English
Reducing latency and energy consumption is critical to improving the efficiency of memory systems in modern computing. This work introduces ReLMXEL (Reinforcement Learning for Memory Controller with Explainable Energy and Latency Optimization), a explainable multi-agent online reinforcement learning framework that dynamically optimizes memory controller parameters using reward decomposition. ReLMXEL operates within the memory controller, leveraging detailed memory behavior metrics to guide decision-making. Experimental evaluations across diverse workloads demonstrate consistent performance gains over baseline configurations, with refinements driven by workload-specific memory access behaviour. By incorporating explainability into the learning process, ReLMXEL not only enhances performance but also increases the transparency of control decisions, paving the way for more accountable and adaptive memory system designs.