AutoTrain: Обучение без кода для моделей последнего поколения
AutoTrain: No-code training for state-of-the-art models
October 21, 2024
Авторы: Abhishek Thakur
cs.AI
Аннотация
С развитием открытых моделей обучение (или донастройка) моделей на пользовательских наборах данных стало важной частью разработки решений, адаптированных к конкретным промышленным или открытым приложениям. Однако не существует единого инструмента, который упростил бы процесс обучения на различных типах модальностей или задач. Мы представляем AutoTrain (также известный как AutoTrain Advanced) - открытый инструмент/библиотеку без кода, которую можно использовать для обучения (или донастройки) моделей для различных типов задач, таких как: донастройка большой языковой модели (LLM), классификация/регрессия текста, классификация токенов, задача последовательность-последовательность, донастройка предложений-трансформеров, донастройка визуальной языковой модели (VLM), классификация/регрессия изображений, а также классификация и регрессия на табличных данных. AutoTrain Advanced - это открытая библиотека, предоставляющая bew practices для обучения моделей на пользовательских наборах данных. Библиотека доступна по адресу https://github.com/huggingface/autotrain-advanced. AutoTrain можно использовать в полностью локальном режиме или на облачных машинах и работает с десятками тысяч моделей, размещенных на платформе Hugging Face Hub, и их вариациями.
English
With the advancements in open-source models, training (or finetuning) models
on custom datasets has become a crucial part of developing solutions which are
tailored to specific industrial or open-source applications. Yet, there is no
single tool which simplifies the process of training across different types of
modalities or tasks. We introduce AutoTrain (aka AutoTrain Advanced) -- an
open-source, no code tool/library which can be used to train (or finetune)
models for different kinds of tasks such as: large language model (LLM)
finetuning, text classification/regression, token classification,
sequence-to-sequence task, finetuning of sentence transformers, visual language
model (VLM) finetuning, image classification/regression and even classification
and regression tasks on tabular data. AutoTrain Advanced is an open-source
library providing best practices for training models on custom datasets. The
library is available at https://github.com/huggingface/autotrain-advanced.
AutoTrain can be used in fully local mode or on cloud machines and works with
tens of thousands of models shared on Hugging Face Hub and their variations.Summary
AI-Generated Summary