ChatPaper.aiChatPaper

AutoTrain: Обучение без кода для моделей последнего поколения

AutoTrain: No-code training for state-of-the-art models

October 21, 2024
Авторы: Abhishek Thakur
cs.AI

Аннотация

С развитием открытых моделей обучение (или донастройка) моделей на пользовательских наборах данных стало важной частью разработки решений, адаптированных к конкретным промышленным или открытым приложениям. Однако не существует единого инструмента, который упростил бы процесс обучения на различных типах модальностей или задач. Мы представляем AutoTrain (также известный как AutoTrain Advanced) - открытый инструмент/библиотеку без кода, которую можно использовать для обучения (или донастройки) моделей для различных типов задач, таких как: донастройка большой языковой модели (LLM), классификация/регрессия текста, классификация токенов, задача последовательность-последовательность, донастройка предложений-трансформеров, донастройка визуальной языковой модели (VLM), классификация/регрессия изображений, а также классификация и регрессия на табличных данных. AutoTrain Advanced - это открытая библиотека, предоставляющая bew practices для обучения моделей на пользовательских наборах данных. Библиотека доступна по адресу https://github.com/huggingface/autotrain-advanced. AutoTrain можно использовать в полностью локальном режиме или на облачных машинах и работает с десятками тысяч моделей, размещенных на платформе Hugging Face Hub, и их вариациями.
English
With the advancements in open-source models, training (or finetuning) models on custom datasets has become a crucial part of developing solutions which are tailored to specific industrial or open-source applications. Yet, there is no single tool which simplifies the process of training across different types of modalities or tasks. We introduce AutoTrain (aka AutoTrain Advanced) -- an open-source, no code tool/library which can be used to train (or finetune) models for different kinds of tasks such as: large language model (LLM) finetuning, text classification/regression, token classification, sequence-to-sequence task, finetuning of sentence transformers, visual language model (VLM) finetuning, image classification/regression and even classification and regression tasks on tabular data. AutoTrain Advanced is an open-source library providing best practices for training models on custom datasets. The library is available at https://github.com/huggingface/autotrain-advanced. AutoTrain can be used in fully local mode or on cloud machines and works with tens of thousands of models shared on Hugging Face Hub and their variations.
PDF602November 16, 2024