ChatPaper.aiChatPaper

ActionStudio: Ein leichtgewichtiges Framework für Daten und Training großer Aktionsmodelle

ActionStudio: A Lightweight Framework for Data and Training of Large Action Models

March 28, 2025
Autoren: Jianguo Zhang, Thai Hoang, Ming Zhu, Zuxin Liu, Shiyu Wang, Tulika Awalgaonkar, Akshara Prabhakar, Haolin Chen, Weiran Yao, Zhiwei Liu, Juntao Tan, Juan Carlos Niebles, Shelby Heinecke, Huan Wang, Silvio Savarese, Caiming Xiong
cs.AI

Zusammenfassung

Aktionsmodelle sind entscheidend, um autonomen Agenten die Ausführung komplexer Aufgaben zu ermöglichen. Das Training großer Aktionsmodelle bleibt jedoch aufgrund der Vielfalt der Agentenumgebungen und der Komplexität der agentenspezifischen Daten eine Herausforderung. Trotz des wachsenden Interesses bietet die bestehende Infrastruktur nur begrenzte Unterstützung für skalierbares, agentenspezifisches Fine-Tuning. Wir stellen ActionStudio vor, ein leichtgewichtiges und erweiterbares Daten- und Trainingsframework, das für große Aktionsmodelle entwickelt wurde. ActionStudio vereinheitlicht heterogene Agententrajektorien durch ein standardisiertes Format, unterstützt diverse Trainingsparadigmen wie LoRA, vollständiges Fine-Tuning und verteilte Setups und integriert robuste Vorverarbeitungs- und Verifizierungswerkzeuge. Wir validieren seine Wirksamkeit anhand öffentlicher und realistischer Industriebenchmarks und zeigen dabei starke Leistung und praktische Skalierbarkeit. Wir haben den Code und die Daten unter https://github.com/SalesforceAIResearch/xLAM veröffentlicht, um die Forschung in der Community zu fördern.
English
Action models are essential for enabling autonomous agents to perform complex tasks. However, training large action models remains challenging due to the diversity of agent environments and the complexity of agentic data. Despite growing interest, existing infrastructure provides limited support for scalable, agent-specific fine-tuning. We present ActionStudio, a lightweight and extensible data and training framework designed for large action models. ActionStudio unifies heterogeneous agent trajectories through a standardized format, supports diverse training paradigms including LoRA, full fine-tuning, and distributed setups, and integrates robust preprocessing and verification tools. We validate its effectiveness across both public and realistic industry benchmarks, demonstrating strong performance and practical scalability. We open-sourced code and data at https://github.com/SalesforceAIResearch/xLAM to facilitate research in the community.

Summary

AI-Generated Summary

PDF122April 1, 2025