LoraHub: Generalización Eficiente entre Tareas mediante Composición Dinámica de LoRA
LoraHub: Efficient Cross-Task Generalization via Dynamic LoRA Composition
July 25, 2023
Autores: Chengsong Huang, Qian Liu, Bill Yuchen Lin, Tianyu Pang, Chao Du, Min Lin
cs.AI
Resumen
Las adaptaciones de bajo rango (LoRA, por sus siglas en inglés) se emplean con frecuencia para ajustar modelos de lenguaje de gran escala (LLMs) en nuevas tareas. Este artículo investiga la composición de LoRA para la generalización entre tareas e introduce LoraHub, un marco estratégico diseñado para el ensamblaje intencional de módulos LoRA entrenados en diversas tareas, con el objetivo de lograr un rendimiento adaptable en tareas no vistas. Con solo unos pocos ejemplos de una tarea novedosa, LoraHub permite la combinación fluida de múltiples módulos LoRA, eliminando la necesidad de experiencia humana. Cabe destacar que la composición no requiere parámetros adicionales del modelo ni gradientes. Nuestros resultados empíricos, obtenidos del benchmark Big-Bench Hard (BBH), sugieren que LoraHub puede imitar eficazmente el rendimiento del aprendizaje en contexto (in-context learning) en escenarios de pocos ejemplos (few-shot), sin necesidad de incluir ejemplos en contexto junto a cada entrada de inferencia. Una contribución significativa de nuestra investigación es el fomento de una comunidad para LoRA, donde los usuarios pueden compartir sus módulos LoRA entrenados, facilitando así su aplicación a nuevas tareas. Anticipamos que este recurso ampliará el acceso y fomentará avances en la inteligencia general, así como en los LLMs en producción. El código estará disponible en https://github.com/sail-sg/lorahub.
English
Low-rank adaptations (LoRA) are often employed to fine-tune large language
models (LLMs) for new tasks. This paper investigates LoRA composability for
cross-task generalization and introduces LoraHub, a strategic framework devised
for the purposive assembly of LoRA modules trained on diverse given tasks, with
the objective of achieving adaptable performance on unseen tasks. With just a
few examples from a novel task, LoraHub enables the fluid combination of
multiple LoRA modules, eradicating the need for human expertise. Notably, the
composition requires neither additional model parameters nor gradients. Our
empirical results, derived from the Big-Bench Hard (BBH) benchmark, suggest
that LoraHub can effectively mimic the performance of in-context learning in
few-shot scenarios, excluding the necessity of in-context examples alongside
each inference input. A significant contribution of our research is the
fostering of a community for LoRA, where users can share their trained LoRA
modules, thereby facilitating their application to new tasks. We anticipate
this resource will widen access to and spur advancements in general
intelligence as well as LLMs in production. Code will be available at
https://github.com/sail-sg/lorahub.