ChatPaper.aiChatPaper

MobiLlama : Vers un GPT entièrement transparent, précis et léger

MobiLlama: Towards Accurate and Lightweight Fully Transparent GPT

February 26, 2024
Auteurs: Omkar Thawakar, Ashmal Vayani, Salman Khan, Hisham Cholakal, Rao M. Anwer, Michael Felsberg, Tim Baldwin, Eric P. Xing, Fahad Shahbaz Khan
cs.AI

Résumé

"Plus grand est mieux" a été la tendance dominante dans le développement récent des grands modèles de langage (LLM). Cependant, les LLM ne conviennent pas bien aux scénarios nécessitant un traitement sur appareil, une efficacité énergétique, une empreinte mémoire réduite et une réponse rapide. Ces exigences sont cruciales pour la confidentialité, la sécurité et un déploiement durable. Cet article explore le paradigme "moins c'est plus" en relevant le défi de concevoir des petits modèles de langage (SLM) précis et efficaces pour les appareils à ressources limitées. Notre contribution principale est l'introduction d'un SLM open-source précis et entièrement transparent de 0,5 milliard de paramètres, nommé MobiLlama, répondant aux besoins spécifiques du calcul à ressources contraintes avec un accent sur une performance accrue et des demandes de ressources réduites. MobiLlama est une conception de SLM qui part d'un modèle plus grand et applique un schéma minutieux de partage de paramètres pour réduire à la fois le coût de pré-entraînement et de déploiement. Notre travail vise non seulement à combler le manque de SLM open-source, mais aussi à garantir une transparence totale, où l'ensemble du pipeline de données d'entraînement, le code d'entraînement, les poids du modèle, ainsi que plus de 300 points de contrôle et les codes d'évaluation sont disponibles à l'adresse suivante : https://github.com/mbzuai-oryx/MobiLlama.
English
"Bigger the better" has been the predominant trend in recent Large Language Models (LLMs) development. However, LLMs do not suit well for scenarios that require on-device processing, energy efficiency, low memory footprint, and response efficiency. These requisites are crucial for privacy, security, and sustainable deployment. This paper explores the "less is more" paradigm by addressing the challenge of designing accurate yet efficient Small Language Models (SLMs) for resource constrained devices. Our primary contribution is the introduction of an accurate and fully transparent open-source 0.5 billion (0.5B) parameter SLM, named MobiLlama, catering to the specific needs of resource-constrained computing with an emphasis on enhanced performance with reduced resource demands. MobiLlama is a SLM design that initiates from a larger model and applies a careful parameter sharing scheme to reduce both the pre-training and the deployment cost. Our work strives to not only bridge the gap in open-source SLMs but also ensures full transparency, where complete training data pipeline, training code, model weights, and over 300 checkpoints along with evaluation codes is available at : https://github.com/mbzuai-oryx/MobiLlama.
PDF271December 15, 2024