ChatPaper.aiChatPaper

AutoTrain: Entrenamiento sin código para modelos de última generación

AutoTrain: No-code training for state-of-the-art models

October 21, 2024
Autores: Abhishek Thakur
cs.AI

Resumen

Con los avances en modelos de código abierto, el entrenamiento (o ajuste fino) de modelos en conjuntos de datos personalizados se ha convertido en una parte crucial del desarrollo de soluciones adaptadas a aplicaciones industriales específicas o de código abierto. Sin embargo, no existe una única herramienta que simplifique el proceso de entrenamiento en diferentes tipos de modalidades o tareas. Presentamos AutoTrain (también conocido como AutoTrain Advanced) - una herramienta/biblioteca de código abierto que se puede utilizar para entrenar (o ajustar fino) modelos para diferentes tipos de tareas como: ajuste fino de modelos de lenguaje grande (LLM), clasificación/regresión de texto, clasificación de tokens, tarea de secuencia a secuencia, ajuste fino de transformadores de oraciones, ajuste fino de modelos de lenguaje visual (VLM), clasificación/regresión de imágenes e incluso tareas de clasificación y regresión en datos tabulares. AutoTrain Advanced es una biblioteca de código abierto que proporciona las mejores prácticas para entrenar modelos en conjuntos de datos personalizados. La biblioteca está disponible en https://github.com/huggingface/autotrain-advanced. AutoTrain se puede utilizar en modo completamente local o en máquinas en la nube y funciona con decenas de miles de modelos compartidos en Hugging Face Hub y sus variaciones.
English
With the advancements in open-source models, training (or finetuning) models on custom datasets has become a crucial part of developing solutions which are tailored to specific industrial or open-source applications. Yet, there is no single tool which simplifies the process of training across different types of modalities or tasks. We introduce AutoTrain (aka AutoTrain Advanced) -- an open-source, no code tool/library which can be used to train (or finetune) models for different kinds of tasks such as: large language model (LLM) finetuning, text classification/regression, token classification, sequence-to-sequence task, finetuning of sentence transformers, visual language model (VLM) finetuning, image classification/regression and even classification and regression tasks on tabular data. AutoTrain Advanced is an open-source library providing best practices for training models on custom datasets. The library is available at https://github.com/huggingface/autotrain-advanced. AutoTrain can be used in fully local mode or on cloud machines and works with tens of thousands of models shared on Hugging Face Hub and their variations.

Summary

AI-Generated Summary

PDF602November 16, 2024