ChatPaper.aiChatPaper

В глубоком обучении с подкреплением, прореженная сеть — это хорошая сеть.

In deep reinforcement learning, a pruned network is a good network

February 19, 2024
Авторы: Johan Obando-Ceron, Aaron Courville, Pablo Samuel Castro
cs.AI

Аннотация

Недавние исследования показали, что агенты глубокого обучения с подкреплением испытывают трудности в эффективном использовании параметров своих сетей. Мы опираемся на предыдущие инсайты о преимуществах методов разреженного обучения и демонстрируем, что постепенное обрезание по величине позволяет агентам максимизировать эффективность использования параметров. Это приводит к созданию сетей, которые демонстрируют значительное улучшение производительности по сравнению с традиционными сетями и проявляют своего рода "закон масштабирования", используя лишь небольшую часть всех параметров сети.
English
Recent work has shown that deep reinforcement learning agents have difficulty in effectively using their network parameters. We leverage prior insights into the advantages of sparse training techniques and demonstrate that gradual magnitude pruning enables agents to maximize parameter effectiveness. This results in networks that yield dramatic performance improvements over traditional networks and exhibit a type of "scaling law", using only a small fraction of the full network parameters.
PDF191December 15, 2024