ChatPaper.aiChatPaper

ActionStudio : Un cadre léger pour la gestion des données et l'entraînement de grands modèles d'actions

ActionStudio: A Lightweight Framework for Data and Training of Large Action Models

March 28, 2025
Auteurs: Jianguo Zhang, Thai Hoang, Ming Zhu, Zuxin Liu, Shiyu Wang, Tulika Awalgaonkar, Akshara Prabhakar, Haolin Chen, Weiran Yao, Zhiwei Liu, Juntao Tan, Juan Carlos Niebles, Shelby Heinecke, Huan Wang, Silvio Savarese, Caiming Xiong
cs.AI

Résumé

Les modèles d'action sont essentiels pour permettre aux agents autonomes d'exécuter des tâches complexes. Cependant, l'entraînement de grands modèles d'action reste un défi en raison de la diversité des environnements des agents et de la complexité des données agentiques. Malgré un intérêt croissant, l'infrastructure existante offre un soutien limité pour un ajustement fin spécifique aux agents et évolutif. Nous présentons ActionStudio, un cadre de données et d'entraînement léger et extensible conçu pour les grands modèles d'action. ActionStudio unifie les trajectoires hétérogènes des agents grâce à un format standardisé, prend en charge divers paradigmes d'entraînement incluant LoRA, l'ajustement fin complet et les configurations distribuées, et intègre des outils robustes de prétraitement et de vérification. Nous validons son efficacité sur des benchmarks publics et réalistes de l'industrie, démontrant des performances solides et une scalabilité pratique. Nous avons ouvert le code et les données sur https://github.com/SalesforceAIResearch/xLAM pour faciliter la recherche dans la communauté.
English
Action models are essential for enabling autonomous agents to perform complex tasks. However, training large action models remains challenging due to the diversity of agent environments and the complexity of agentic data. Despite growing interest, existing infrastructure provides limited support for scalable, agent-specific fine-tuning. We present ActionStudio, a lightweight and extensible data and training framework designed for large action models. ActionStudio unifies heterogeneous agent trajectories through a standardized format, supports diverse training paradigms including LoRA, full fine-tuning, and distributed setups, and integrates robust preprocessing and verification tools. We validate its effectiveness across both public and realistic industry benchmarks, demonstrating strong performance and practical scalability. We open-sourced code and data at https://github.com/SalesforceAIResearch/xLAM to facilitate research in the community.

Summary

AI-Generated Summary

PDF122April 1, 2025