LoraHub: Эффективное обобщение для кросс-задач с помощью динамической композиции LoRA
LoraHub: Efficient Cross-Task Generalization via Dynamic LoRA Composition
July 25, 2023
Авторы: Chengsong Huang, Qian Liu, Bill Yuchen Lin, Tianyu Pang, Chao Du, Min Lin
cs.AI
Аннотация
Низкоранговые адаптации (LoRA) часто используются для тонкой настройки больших языковых моделей (LLM) для новых задач. В данной статье исследуется композиционность LoRA для обобщения на кросс-задачи и представлен LoraHub — стратегическая структура, разработанная для целенаправленной сборки модулей LoRA, обученных на различных задачах, с целью достижения адаптируемой производительности на неизвестных задачах. Всего лишь с несколькими примерами новой задачи LoraHub позволяет гибко комбинировать несколько модулей LoRA, устраняя необходимость в экспертных знаниях. Примечательно, что композиция не требует дополнительных параметров модели или градиентов. Наши эмпирические результаты, полученные на основе бенчмарка Big-Bench Hard (BBH), показывают, что LoraHub может эффективно имитировать производительность обучения в контексте в условиях малого количества примеров, исключая необходимость использования контекстных примеров для каждого входного вывода. Значительным вкладом нашего исследования является создание сообщества для LoRA, где пользователи могут делиться своими обученными модулями LoRA, тем самым облегчая их применение к новым задачам. Мы ожидаем, что этот ресурс расширит доступ и стимулирует прогресс в области общего интеллекта, а также LLM в производстве. Код будет доступен по адресу https://github.com/sail-sg/lorahub.
English
Low-rank adaptations (LoRA) are often employed to fine-tune large language
models (LLMs) for new tasks. This paper investigates LoRA composability for
cross-task generalization and introduces LoraHub, a strategic framework devised
for the purposive assembly of LoRA modules trained on diverse given tasks, with
the objective of achieving adaptable performance on unseen tasks. With just a
few examples from a novel task, LoraHub enables the fluid combination of
multiple LoRA modules, eradicating the need for human expertise. Notably, the
composition requires neither additional model parameters nor gradients. Our
empirical results, derived from the Big-Bench Hard (BBH) benchmark, suggest
that LoraHub can effectively mimic the performance of in-context learning in
few-shot scenarios, excluding the necessity of in-context examples alongside
each inference input. A significant contribution of our research is the
fostering of a community for LoRA, where users can share their trained LoRA
modules, thereby facilitating their application to new tasks. We anticipate
this resource will widen access to and spur advancements in general
intelligence as well as LLMs in production. Code will be available at
https://github.com/sail-sg/lorahub.