ChatPaper.aiChatPaper

LoraHub: 動的LoRA構成による効率的なクロスタスク汎化

LoraHub: Efficient Cross-Task Generalization via Dynamic LoRA Composition

July 25, 2023
著者: Chengsong Huang, Qian Liu, Bill Yuchen Lin, Tianyu Pang, Chao Du, Min Lin
cs.AI

要旨

低ランク適応(LoRA)は、大規模言語モデル(LLM)を新しいタスクに微調整するためによく使用されます。本論文では、クロスタスク汎化のためのLoRAの合成可能性を調査し、多様なタスクで訓練されたLoRAモジュールを目的に応じて組み立てるための戦略的フレームワークであるLoraHubを紹介します。これにより、未知のタスクに対して適応可能な性能を達成することを目指します。LoraHubは、新しいタスクからのわずかな例を用いて、複数のLoRAモジュールを柔軟に組み合わせることができ、人間の専門知識を必要としません。特に、この合成には追加のモデルパラメータや勾配を必要としません。Big-Bench Hard(BBH)ベンチマークから得られた実験結果は、LoraHubがfew-shotシナリオにおけるインコンテキスト学習の性能を効果的に模倣できることを示唆しており、各推論入力にインコンテキスト例を必要としません。本研究の重要な貢献は、LoRAコミュニティの育成であり、ユーザーが訓練したLoRAモジュールを共有し、新しいタスクへの適用を容易にします。このリソースが、一般知能および生産環境におけるLLMのアクセスを広げ、進歩を促進することを期待しています。コードはhttps://github.com/sail-sg/lorahubで公開されます。
English
Low-rank adaptations (LoRA) are often employed to fine-tune large language models (LLMs) for new tasks. This paper investigates LoRA composability for cross-task generalization and introduces LoraHub, a strategic framework devised for the purposive assembly of LoRA modules trained on diverse given tasks, with the objective of achieving adaptable performance on unseen tasks. With just a few examples from a novel task, LoraHub enables the fluid combination of multiple LoRA modules, eradicating the need for human expertise. Notably, the composition requires neither additional model parameters nor gradients. Our empirical results, derived from the Big-Bench Hard (BBH) benchmark, suggest that LoraHub can effectively mimic the performance of in-context learning in few-shot scenarios, excluding the necessity of in-context examples alongside each inference input. A significant contribution of our research is the fostering of a community for LoRA, where users can share their trained LoRA modules, thereby facilitating their application to new tasks. We anticipate this resource will widen access to and spur advancements in general intelligence as well as LLMs in production. Code will be available at https://github.com/sail-sg/lorahub.
PDF322December 15, 2024