LoraHub: Efficiënte generalisatie over taken via dynamische LoRA-samenstelling
LoraHub: Efficient Cross-Task Generalization via Dynamic LoRA Composition
July 25, 2023
Auteurs: Chengsong Huang, Qian Liu, Bill Yuchen Lin, Tianyu Pang, Chao Du, Min Lin
cs.AI
Samenvatting
Low-rank aanpassingen (LoRA) worden vaak gebruikt om grote taalmmodellen (LLMs) af te stemmen op nieuwe taken. Dit artikel onderzoekt de samenstelbaarheid van LoRA voor kruistaken generalisatie en introduceert LoraHub, een strategisch framework ontworpen voor het doelgerichte samenstellen van LoRA-modules die getraind zijn op diverse gegeven taken, met als doel aanpasbare prestaties te bereiken op onbekende taken. Met slechts enkele voorbeelden van een nieuwe taak maakt LoraHub de vloeiende combinatie van meerdere LoRA-modules mogelijk, waardoor de noodzaak van menselijke expertise wordt weggenomen. Opmerkelijk is dat de samenstelling geen extra modelparameters of gradienten vereist. Onze empirische resultaten, afgeleid van de Big-Bench Hard (BBH) benchmark, suggereren dat LoraHub effectief de prestaties van in-context leren kan nabootsen in few-shot scenario's, zonder de noodzaak van in-context voorbeelden bij elke inferentie-input. Een belangrijke bijdrage van ons onderzoek is het bevorderen van een gemeenschap voor LoRA, waar gebruikers hun getrainde LoRA-modules kunnen delen, waardoor de toepassing ervan op nieuwe taken wordt vergemakkelijkt. We verwachten dat deze bron de toegang zal verbreden en vooruitgang zal stimuleren in algemene intelligentie en LLMs in productie. Code zal beschikbaar zijn op https://github.com/sail-sg/lorahub.
English
Low-rank adaptations (LoRA) are often employed to fine-tune large language
models (LLMs) for new tasks. This paper investigates LoRA composability for
cross-task generalization and introduces LoraHub, a strategic framework devised
for the purposive assembly of LoRA modules trained on diverse given tasks, with
the objective of achieving adaptable performance on unseen tasks. With just a
few examples from a novel task, LoraHub enables the fluid combination of
multiple LoRA modules, eradicating the need for human expertise. Notably, the
composition requires neither additional model parameters nor gradients. Our
empirical results, derived from the Big-Bench Hard (BBH) benchmark, suggest
that LoraHub can effectively mimic the performance of in-context learning in
few-shot scenarios, excluding the necessity of in-context examples alongside
each inference input. A significant contribution of our research is the
fostering of a community for LoRA, where users can share their trained LoRA
modules, thereby facilitating their application to new tasks. We anticipate
this resource will widen access to and spur advancements in general
intelligence as well as LLMs in production. Code will be available at
https://github.com/sail-sg/lorahub.