AgentOhana: Entwurf einer einheitlichen Daten- und Trainingspipeline für effektives Agentenlernen
AgentOhana: Design Unified Data and Training Pipeline for Effective Agent Learning
February 23, 2024
Autoren: Jianguo Zhang, Tian Lan, Rithesh Murthy, Zhiwei Liu, Weiran Yao, Juntao Tan, Thai Hoang, Liangwei Yang, Yihao Feng, Zuxin Liu, Tulika Awalgaonkar, Juan Carlos Niebles, Silvio Savarese, Shelby Heinecke, Huan Wang, Caiming Xiong
cs.AI
Zusammenfassung
Autonome Agenten, die durch große Sprachmodelle (LLMs) angetrieben werden, haben erhebliche Forschungsaufmerksamkeit erlangt. Die vollständige Ausschöpfung des Potenzials von LLMs für agentenbasierte Aufgaben birgt jedoch inhärente Herausforderungen aufgrund der heterogenen Natur verschiedener Datenquellen, die mehrstufige Trajektorien aufweisen. In diesem Artikel stellen wir AgentOhana als umfassende Lösung zur Bewältigung dieser Herausforderungen vor. AgentOhana aggregiert Agententrajektorien aus unterschiedlichen Umgebungen, die eine Vielzahl von Szenarien abdecken. Es standardisiert und vereinheitlicht diese Trajektorien sorgfältig in einem konsistenten Format, wodurch die Erstellung eines generischen Datenladers optimiert für das Agententraining vereinfacht wird. Durch die Datenvereinheitlichung gewährleistet unsere Trainingspipeline ein Gleichgewicht zwischen verschiedenen Datenquellen und bewahrt unabhängige Zufälligkeit über Geräte hinweg während der Datenpartitionierung und des Modelltrainings. Zusätzlich präsentieren wir xLAM-v0.1, ein großes Aktionsmodell, das speziell für KI-Agenten entwickelt wurde und außergewöhnliche Leistung in verschiedenen Benchmarks zeigt.
English
Autonomous agents powered by large language models (LLMs) have garnered
significant research attention. However, fully harnessing the potential of LLMs
for agent-based tasks presents inherent challenges due to the heterogeneous
nature of diverse data sources featuring multi-turn trajectories. In this
paper, we introduce AgentOhana as a comprehensive solution to address
these challenges. AgentOhana aggregates agent trajectories from
distinct environments, spanning a wide array of scenarios. It meticulously
standardizes and unifies these trajectories into a consistent format,
streamlining the creation of a generic data loader optimized for agent
training. Leveraging the data unification, our training pipeline maintains
equilibrium across different data sources and preserves independent randomness
across devices during dataset partitioning and model training. Additionally, we
present xLAM-v0.1, a large action model tailored for AI agents, which
demonstrates exceptional performance across various benchmarks.