ChatPaper.aiChatPaper

AgentOhana : Conception d'un pipeline unifié de données et d'entraînement pour un apprentissage efficace des agents

AgentOhana: Design Unified Data and Training Pipeline for Effective Agent Learning

February 23, 2024
Auteurs: Jianguo Zhang, Tian Lan, Rithesh Murthy, Zhiwei Liu, Weiran Yao, Juntao Tan, Thai Hoang, Liangwei Yang, Yihao Feng, Zuxin Liu, Tulika Awalgaonkar, Juan Carlos Niebles, Silvio Savarese, Shelby Heinecke, Huan Wang, Caiming Xiong
cs.AI

Résumé

Les agents autonomes alimentés par des modèles de langage de grande taille (LLMs) ont suscité une attention significative dans la recherche. Cependant, exploiter pleinement le potentiel des LLMs pour des tâches basées sur des agents présente des défis inhérents en raison de la nature hétérogène des diverses sources de données comportant des trajectoires multi-tours. Dans cet article, nous présentons AgentOhana comme une solution complète pour relever ces défis. AgentOhana agrège les trajectoires d'agents provenant d'environnements distincts, couvrant un large éventail de scénarios. Il standardise et unifie méticuleusement ces trajectoires dans un format cohérent, simplifiant ainsi la création d'un chargeur de données générique optimisé pour l'entraînement des agents. En tirant parti de l'unification des données, notre pipeline d'entraînement maintient un équilibre entre les différentes sources de données et préserve l'aléatoire indépendant entre les appareils lors du partitionnement des ensembles de données et de l'entraînement des modèles. De plus, nous présentons xLAM-v0.1, un modèle d'action de grande taille conçu pour les agents d'IA, qui démontre des performances exceptionnelles sur divers benchmarks.
English
Autonomous agents powered by large language models (LLMs) have garnered significant research attention. However, fully harnessing the potential of LLMs for agent-based tasks presents inherent challenges due to the heterogeneous nature of diverse data sources featuring multi-turn trajectories. In this paper, we introduce AgentOhana as a comprehensive solution to address these challenges. AgentOhana aggregates agent trajectories from distinct environments, spanning a wide array of scenarios. It meticulously standardizes and unifies these trajectories into a consistent format, streamlining the creation of a generic data loader optimized for agent training. Leveraging the data unification, our training pipeline maintains equilibrium across different data sources and preserves independent randomness across devices during dataset partitioning and model training. Additionally, we present xLAM-v0.1, a large action model tailored for AI agents, which demonstrates exceptional performance across various benchmarks.
PDF163December 15, 2024