ChatPaper.aiChatPaper

ActionStudio: Облегченная платформа для обработки данных и обучения крупномасштабных моделей действий

ActionStudio: A Lightweight Framework for Data and Training of Large Action Models

March 28, 2025
Авторы: Jianguo Zhang, Thai Hoang, Ming Zhu, Zuxin Liu, Shiyu Wang, Tulika Awalgaonkar, Akshara Prabhakar, Haolin Chen, Weiran Yao, Zhiwei Liu, Juntao Tan, Juan Carlos Niebles, Shelby Heinecke, Huan Wang, Silvio Savarese, Caiming Xiong
cs.AI

Аннотация

Модели действий имеют ключевое значение для выполнения автономными агентами сложных задач. Однако обучение крупных моделей действий остается сложной задачей из-за разнообразия сред агентов и сложности агентских данных. Несмотря на растущий интерес, существующая инфраструктура предоставляет ограниченную поддержку для масштабируемой, специфичной для агентов тонкой настройки. Мы представляем ActionStudio — легковесный и расширяемый фреймворк для данных и обучения, разработанный для крупных моделей действий. ActionStudio унифицирует гетерогенные траектории агентов через стандартизированный формат, поддерживает разнообразные парадигмы обучения, включая LoRA, полную тонкую настройку и распределенные конфигурации, а также интегрирует надежные инструменты предварительной обработки и проверки. Мы подтверждаем его эффективность на публичных и реалистичных промышленных бенчмарках, демонстрируя высокую производительность и практическую масштабируемость. Мы открыли исходный код и данные на https://github.com/SalesforceAIResearch/xLAM, чтобы способствовать исследованиям в сообществе.
English
Action models are essential for enabling autonomous agents to perform complex tasks. However, training large action models remains challenging due to the diversity of agent environments and the complexity of agentic data. Despite growing interest, existing infrastructure provides limited support for scalable, agent-specific fine-tuning. We present ActionStudio, a lightweight and extensible data and training framework designed for large action models. ActionStudio unifies heterogeneous agent trajectories through a standardized format, supports diverse training paradigms including LoRA, full fine-tuning, and distributed setups, and integrates robust preprocessing and verification tools. We validate its effectiveness across both public and realistic industry benchmarks, demonstrating strong performance and practical scalability. We open-sourced code and data at https://github.com/SalesforceAIResearch/xLAM to facilitate research in the community.

Summary

AI-Generated Summary

PDF122April 1, 2025