Gradient Boosting Verstärkendes Lernen

papers.abstract

Neuronale Netzwerke (NN) erzielen bemerkenswerte Ergebnisse in verschiedenen Aufgaben, weisen jedoch einige Schlüsselmerkmale nicht auf: Interpretierbarkeit, Unterstützung für kategoriale Merkmale und leichte Implementierungen, die für Edge-Geräte geeignet sind. Während laufende Bemühungen darauf abzielen, diese Herausforderungen anzugehen, erfüllen Gradient Boosting Trees (GBT) von Natur aus diese Anforderungen. Als Ergebnis sind GBTs zur bevorzugten Methode für überwachtes Lernen in vielen realen Anwendungen und Wettbewerben geworden. Ihre Anwendung in Szenarien des Online-Lernens, insbesondere im Reinforcement Learning (RL), war jedoch begrenzt. In dieser Arbeit überbrücken wir diese Lücke, indem wir Gradient-Boosting RL (GBRL) einführen, ein Framework, das die Vorteile von GBT auf den RL-Bereich ausweitet. Unter Verwendung des GBRL-Frameworks implementieren wir verschiedene Actor-Critic-Algorithmen und vergleichen ihre Leistung mit ihren NN-Gegenstücken. Inspiriert von gemeinsamen Grundstrukturen in NN führen wir einen Ansatz des Baumteilens für Richtlinien und Wertefunktionen mit unterschiedlichen Lernraten ein, um die Effizienz des Lernens über Millionen von Interaktionen zu steigern. GBRL erzielt eine wettbewerbsfähige Leistung in einer Vielzahl von Aufgaben und zeichnet sich in Domänen mit strukturierten oder kategorialen Merkmalen aus. Darüber hinaus präsentieren wir eine leistungsstarke, GPU-beschleunigte Implementierung, die nahtlos in weit verbreitete RL-Bibliotheken integriert ist (verfügbar unter https://github.com/NVlabs/gbrl). GBRL erweitert das Toolkit für RL-Praktiker und zeigt die Machbarkeit und das Potenzial von GBT innerhalb des RL-Paradigmas auf, insbesondere in Domänen, die durch strukturierte oder kategoriale Merkmale gekennzeichnet sind.

English

Neural networks (NN) achieve remarkable results in various tasks, but lack key characteristics: interpretability, support for categorical features, and lightweight implementations suitable for edge devices. While ongoing efforts aim to address these challenges, Gradient Boosting Trees (GBT) inherently meet these requirements. As a result, GBTs have become the go-to method for supervised learning tasks in many real-world applications and competitions. However, their application in online learning scenarios, notably in reinforcement learning (RL), has been limited. In this work, we bridge this gap by introducing Gradient-Boosting RL (GBRL), a framework that extends the advantages of GBT to the RL domain. Using the GBRL framework, we implement various actor-critic algorithms and compare their performance with their NN counterparts. Inspired by shared backbones in NN we introduce a tree-sharing approach for policy and value functions with distinct learning rates, enhancing learning efficiency over millions of interactions. GBRL achieves competitive performance across a diverse array of tasks, excelling in domains with structured or categorical features. Additionally, we present a high-performance, GPU-accelerated implementation that integrates seamlessly with widely-used RL libraries (available at https://github.com/NVlabs/gbrl). GBRL expands the toolkit for RL practitioners, demonstrating the viability and promise of GBT within the RL paradigm, particularly in domains characterized by structured or categorical features.

Gradient Boosting Verstärkendes Lernen

Gradient Boosting Reinforcement Learning

papers.abstract

Support