Aurora-M: Первая мультиязычная модель языка с открытым исходным кодом, протестированная по методике Red Team в соответствии с указом исполнительной власти США.Aurora-M: The First Open Source Multilingual Language Model Red-teamed
according to the U.S. Executive Order
Предварительно обученные языковые модели лежат в основе нескольких приложений искусственного интеллекта, однако их высокая вычислительная стоимость для обучения ограничивает доступность. Инициативы, такие как BLOOM и StarCoder, нацелены на демократизацию доступа к предварительно обученным моделям для совместного развития сообщества. Однако такие существующие модели сталкиваются с вызовами: ограниченные мультиязычные возможности, постоянное предварительное обучение, вызывающее катастрофическое забывание, в то время как обучение с нуля требует больших вычислительных затрат, а также соответствие законам об искусственном интеллекте и развитии. В данной статье представлена модель Aurora-M, мультиязычная модель с открытым исходным кодом на 15 миллиардов параметров, обученная на английском, финском, хинди, японском, вьетнамском и коде. Непрерывно предварительно обученная из StarCoderPlus на 435 миллиардов дополнительных токенов, Aurora-M превосходит общее количество обучающих токенов в 2 триллиона. Это первая мультиязычная модель с открытым исходным кодом, донастроенная на инструкциях по безопасности, проверенных людьми, что выравнивает ее развитие не только с традиционными рассмотрениями красной команды, но и с конкретными опасениями, выраженными в Постановлении Президента Байдена-Харриса о безопасном, надежном и доверительном развитии и использовании искусственного интеллекта. Aurora-M тщательно оценивается на различных задачах и языках, демонстрируя устойчивость к катастрофическому забыванию и превосходя альтернативы в мультиязычных средах, особенно в оценках безопасности. Для поощрения ответственного развития мультиязычных моделей с открытым исходным кодом Aurora-M и ее варианты выпущены по адресу https://huggingface.co/collections/aurora-m/aurora-m-models-65fdfdff62471e09812f5407.