ChatPaper.aiChatPaper

LlamaFactory: Ajuste Fino Unificado e Eficiente de Mais de 100 Modelos de Linguagem

LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models

March 20, 2024
Autores: Yaowei Zheng, Richong Zhang, Junhao Zhang, Yanhan Ye, Zheyan Luo
cs.AI

Resumo

O ajuste fino eficiente é crucial para adaptar grandes modelos de linguagem (LLMs) a tarefas subsequentes. No entanto, implementar esses métodos em diferentes modelos requer esforços consideráveis. Apresentamos o LlamaFactory, uma estrutura unificada que integra um conjunto de métodos de treinamento eficiente de ponta. Ele permite que os usuários personalizem flexivelmente o ajuste fino de mais de 100 LLMs sem a necessidade de codificação por meio da interface web integrada, o LlamaBoard. Validamos empiricamente a eficiência e a eficácia de nossa estrutura em tarefas de modelagem de linguagem e geração de texto. Ela foi lançada em https://github.com/hiyouga/LLaMA-Factory e já recebeu mais de 13.000 estrelas e 1.600 forks.
English
Efficient fine-tuning is vital for adapting large language models (LLMs) to downstream tasks. However, it requires non-trivial efforts to implement these methods on different models. We present LlamaFactory, a unified framework that integrates a suite of cutting-edge efficient training methods. It allows users to flexibly customize the fine-tuning of 100+ LLMs without the need for coding through the built-in web UI LlamaBoard. We empirically validate the efficiency and effectiveness of our framework on language modeling and text generation tasks. It has been released at https://github.com/hiyouga/LLaMA-Factory and already received over 13,000 stars and 1,600 forks.
PDF1786February 7, 2026