ChatPaper.aiChatPaper

ActionStudio: 대규모 액션 모델을 위한 데이터 및 훈련 경량 프레임워크

ActionStudio: A Lightweight Framework for Data and Training of Large Action Models

March 28, 2025
저자: Jianguo Zhang, Thai Hoang, Ming Zhu, Zuxin Liu, Shiyu Wang, Tulika Awalgaonkar, Akshara Prabhakar, Haolin Chen, Weiran Yao, Zhiwei Liu, Juntao Tan, Juan Carlos Niebles, Shelby Heinecke, Huan Wang, Silvio Savarese, Caiming Xiong
cs.AI

초록

액션 모델은 자율 에이전트가 복잡한 작업을 수행할 수 있도록 하는 데 필수적입니다. 그러나 다양한 에이전트 환경과 에이전트 데이터의 복잡성으로 인해 대규모 액션 모델을 훈련하는 것은 여전히 어려운 과제로 남아 있습니다. 점점 더 많은 관심이 집중되고 있음에도 불구하고, 기존 인프라는 확장 가능한 에이전트 특화 미세 조정을 위한 지원이 제한적입니다. 우리는 대규모 액션 모델을 위해 설계된 경량화되고 확장 가능한 데이터 및 훈련 프레임워크인 ActionStudio를 소개합니다. ActionStudio는 표준화된 형식을 통해 이질적인 에이전트 궤적을 통합하고, LoRA, 전체 미세 조정, 분산 설정을 포함한 다양한 훈련 패러다임을 지원하며, 강력한 전처리 및 검증 도구를 통합합니다. 우리는 공개 및 현실적인 산업 벤치마크를 통해 그 효과를 검증하며, 강력한 성능과 실용적인 확장성을 입증합니다. 커뮤니티의 연구를 촉진하기 위해 코드와 데이터를 https://github.com/SalesforceAIResearch/xLAM에서 오픈소스로 공개했습니다.
English
Action models are essential for enabling autonomous agents to perform complex tasks. However, training large action models remains challenging due to the diversity of agent environments and the complexity of agentic data. Despite growing interest, existing infrastructure provides limited support for scalable, agent-specific fine-tuning. We present ActionStudio, a lightweight and extensible data and training framework designed for large action models. ActionStudio unifies heterogeneous agent trajectories through a standardized format, supports diverse training paradigms including LoRA, full fine-tuning, and distributed setups, and integrates robust preprocessing and verification tools. We validate its effectiveness across both public and realistic industry benchmarks, demonstrating strong performance and practical scalability. We open-sourced code and data at https://github.com/SalesforceAIResearch/xLAM to facilitate research in the community.

Summary

AI-Generated Summary

PDF122April 1, 2025