ChatPaper.aiChatPaper

MobiLlama: Auf dem Weg zu einem präzisen und leichten vollständig transparenten GPT

MobiLlama: Towards Accurate and Lightweight Fully Transparent GPT

February 26, 2024
Autoren: Omkar Thawakar, Ashmal Vayani, Salman Khan, Hisham Cholakal, Rao M. Anwer, Michael Felsberg, Tim Baldwin, Eric P. Xing, Fahad Shahbaz Khan
cs.AI

Zusammenfassung

"Größer ist besser" war der vorherrschende Trend in der jüngsten Entwicklung von Large Language Models (LLMs). Allerdings eignen sich LLMs nicht gut für Szenarien, die On-Device-Verarbeitung, Energieeffizienz, einen geringen Speicherbedarf und schnelle Antwortzeiten erfordern. Diese Anforderungen sind entscheidend für Datenschutz, Sicherheit und eine nachhaltige Bereitstellung. Dieses Papier untersucht das Paradigma "Weniger ist mehr", indem es die Herausforderung angeht, präzise und dennoch effiziente Small Language Models (SLMs) für ressourcenbeschränkte Geräte zu entwerfen. Unser Hauptbeitrag ist die Einführung eines präzisen und vollständig transparenten Open-Source-SLMs mit 0,5 Milliarden (0,5B) Parametern, genannt MobiLlama, das auf die spezifischen Anforderungen des ressourcenbeschränkten Rechnens zugeschnitten ist und eine verbesserte Leistung bei reduziertem Ressourcenbedarf bietet. MobiLlama ist ein SLM-Design, das von einem größeren Modell ausgeht und ein sorgfältiges Parameter-Sharing-Schema anwendet, um sowohl die Vorabschulungskosten als auch die Bereitstellungskosten zu reduzieren. Unsere Arbeit zielt darauf ab, nicht nur die Lücke bei Open-Source-SLMs zu schließen, sondern auch vollständige Transparenz zu gewährleisten, wobei der vollständige Trainingsdatenpipeline, Trainingscode, Modellgewichte und über 300 Checkpoints zusammen mit Evaluierungscodes unter folgendem Link verfügbar sind: https://github.com/mbzuai-oryx/MobiLlama.
English
"Bigger the better" has been the predominant trend in recent Large Language Models (LLMs) development. However, LLMs do not suit well for scenarios that require on-device processing, energy efficiency, low memory footprint, and response efficiency. These requisites are crucial for privacy, security, and sustainable deployment. This paper explores the "less is more" paradigm by addressing the challenge of designing accurate yet efficient Small Language Models (SLMs) for resource constrained devices. Our primary contribution is the introduction of an accurate and fully transparent open-source 0.5 billion (0.5B) parameter SLM, named MobiLlama, catering to the specific needs of resource-constrained computing with an emphasis on enhanced performance with reduced resource demands. MobiLlama is a SLM design that initiates from a larger model and applies a careful parameter sharing scheme to reduce both the pre-training and the deployment cost. Our work strives to not only bridge the gap in open-source SLMs but also ensures full transparency, where complete training data pipeline, training code, model weights, and over 300 checkpoints along with evaluation codes is available at : https://github.com/mbzuai-oryx/MobiLlama.
PDF271December 15, 2024