Aurora-M : Le premier modèle de langage multilingue open source soumis à un test d'évaluation critique conformément au décret exécutif américainAurora-M: The First Open Source Multilingual Language Model Red-teamed
according to the U.S. Executive Order
Les modèles de langage pré-entraînés constituent la base de plusieurs applications d'IA, mais leur coût de calcul élevé pour l'entraînement limite leur accessibilité. Des initiatives telles que BLOOM et StarCoder visent à démocratiser l'accès aux modèles pré-entraînés pour un développement communautaire collaboratif. Cependant, ces modèles existants rencontrent des défis : des capacités multilingues limitées, un pré-entraînement continu entraînant un oubli catastrophique, tandis qu'un pré-entraînement à partir de zéro est coûteux en calcul, et la conformité aux lois sur la sécurité et le développement de l'IA. Ce document présente Aurora-M, un modèle open-source multilingue de 15 milliards de paramètres entraîné sur l'anglais, le finnois, l'hindi, le japonais, le vietnamien et le code. Pré-entraîné continuellement à partir de StarCoderPlus sur 435 milliards de tokens supplémentaires, Aurora-M dépasse les 2 000 milliards de tokens dans le total des tokens d'entraînement. Il s'agit du premier modèle open-source multilingue affiné sur des instructions de sécurité examinées par des humains, alignant ainsi son développement non seulement sur les considérations conventionnelles de red-teaming, mais aussi sur les préoccupations spécifiques exprimées dans l'ordre exécutif Biden-Harris sur le développement et l'utilisation sûrs, sécurisés et dignes de confiance de l'intelligence artificielle. Aurora-M est rigoureusement évalué sur diverses tâches et langues, démontrant une robustesse contre l'oubli catastrophique et surpassant les alternatives dans des contextes multilingues, en particulier dans les évaluations de sécurité. Pour promouvoir un développement responsable des LLM open-source, Aurora-M et ses variantes sont publiés sur https://huggingface.co/collections/aurora-m/aurora-m-models-65fdfdff62471e09812f5407.