ChatPaper.aiChatPaper

Pearl: Ein produktionsreifer Reinforcement-Learning-Agent

Pearl: A Production-ready Reinforcement Learning Agent

December 6, 2023
Autoren: Zheqing Zhu, Rodrigo de Salvo Braz, Jalaj Bhandari, Daniel Jiang, Yi Wan, Yonathan Efroni, Liyuan Wang, Ruiyang Xu, Hongbo Guo, Alex Nikulkov, Dmytro Korenkevych, Urun Dogan, Frank Cheng, Zheng Wu, Wanqiao Xu
cs.AI

Zusammenfassung

Reinforcement Learning (RL) bietet ein vielseitiges Framework zur Erreichung langfristiger Ziele. Seine Allgemeingültigkeit ermöglicht es uns, eine breite Palette von Problemen zu formalisieren, mit denen intelligente Systeme in der realen Welt konfrontiert sind, wie z. B. der Umgang mit verzögerten Belohnungen, die Handhabung von partieller Beobachtbarkeit, die Bewältigung des Dilemmas zwischen Exploration und Exploitation, die Nutzung von Offline-Daten zur Verbesserung der Online-Leistung und die Einhaltung von Sicherheitsbeschränkungen. Trotz erheblicher Fortschritte, die die RL-Forschungsgemeinschaft bei der Bewältigung dieser Probleme erzielt hat, konzentrieren sich bestehende Open-Source-RL-Bibliotheken tendenziell auf einen engen Ausschnitt des RL-Lösungsprozesses, während andere Aspekte weitgehend unberücksichtigt bleiben. Dieses Papier stellt Pearl vor, ein produktionsreifes RL-Agenten-Softwarepaket, das explizit darauf ausgelegt ist, diese Herausforderungen in modularer Weise zu bewältigen. Neben der Präsentation vorläufiger Benchmark-Ergebnisse hebt dieses Papier die industriellen Anwendungen von Pearl hervor, um seine Produktionsreife zu demonstrieren. Pearl ist auf Github unter github.com/facebookresearch/pearl quelloffen verfügbar, und seine offizielle Website befindet sich unter pearlagent.github.io.
English
Reinforcement Learning (RL) offers a versatile framework for achieving long-term goals. Its generality allows us to formalize a wide range of problems that real-world intelligent systems encounter, such as dealing with delayed rewards, handling partial observability, addressing the exploration and exploitation dilemma, utilizing offline data to improve online performance, and ensuring safety constraints are met. Despite considerable progress made by the RL research community in addressing these issues, existing open-source RL libraries tend to focus on a narrow portion of the RL solution pipeline, leaving other aspects largely unattended. This paper introduces Pearl, a Production-ready RL agent software package explicitly designed to embrace these challenges in a modular fashion. In addition to presenting preliminary benchmark results, this paper highlights Pearl's industry adoptions to demonstrate its readiness for production usage. Pearl is open sourced on Github at github.com/facebookresearch/pearl and its official website is located at pearlagent.github.io.
PDF162December 15, 2024