ChatPaper.aiChatPaper

MobiLlama: Op Weg naar Nauwkeurige en Lichtgewicht Volledig Transparante GPT

MobiLlama: Towards Accurate and Lightweight Fully Transparent GPT

February 26, 2024
Auteurs: Omkar Thawakar, Ashmal Vayani, Salman Khan, Hisham Cholakal, Rao M. Anwer, Michael Felsberg, Tim Baldwin, Eric P. Xing, Fahad Shahbaz Khan
cs.AI

Samenvatting

"Groter is beter" is de dominante trend geweest in de recente ontwikkeling van Large Language Models (LLM's). LLM's zijn echter niet goed geschikt voor scenario's die on-device verwerking, energie-efficiëntie, een laag geheugengebruik en reactie-efficiëntie vereisen. Deze vereisten zijn cruciaal voor privacy, veiligheid en duurzame implementatie. Dit artikel verkent het "minder is meer"-paradigma door de uitdaging aan te gaan van het ontwerpen van nauwkeurige maar efficiënte Small Language Models (SLM's) voor apparaten met beperkte middelen. Onze belangrijkste bijdrage is de introductie van een nauwkeurig en volledig transparant open-source SLM met 0,5 miljard (0,5B) parameters, genaamd MobiLlama, dat specifiek is ontworpen voor de behoeften van rekenkrachtarme apparaten, met de nadruk op verbeterde prestaties met verminderde resource-eisen. MobiLlama is een SLM-ontwerp dat uitgaat van een groter model en een zorgvuldig parameterscheidingsschema toepast om zowel de pre-trainings- als de implementatiekosten te verlagen. Ons werk streeft ernaar om niet alleen de kloof in open-source SLM's te overbruggen, maar ook volledige transparantie te garanderen, waarbij de volledige trainingsdatapijplijn, trainingscode, modelgewichten en meer dan 300 checkpoints samen met evaluatiecodes beschikbaar zijn op: https://github.com/mbzuai-oryx/MobiLlama.
English
"Bigger the better" has been the predominant trend in recent Large Language Models (LLMs) development. However, LLMs do not suit well for scenarios that require on-device processing, energy efficiency, low memory footprint, and response efficiency. These requisites are crucial for privacy, security, and sustainable deployment. This paper explores the "less is more" paradigm by addressing the challenge of designing accurate yet efficient Small Language Models (SLMs) for resource constrained devices. Our primary contribution is the introduction of an accurate and fully transparent open-source 0.5 billion (0.5B) parameter SLM, named MobiLlama, catering to the specific needs of resource-constrained computing with an emphasis on enhanced performance with reduced resource demands. MobiLlama is a SLM design that initiates from a larger model and applies a careful parameter sharing scheme to reduce both the pre-training and the deployment cost. Our work strives to not only bridge the gap in open-source SLMs but also ensures full transparency, where complete training data pipeline, training code, model weights, and over 300 checkpoints along with evaluation codes is available at : https://github.com/mbzuai-oryx/MobiLlama.
PDF261December 15, 2024