ChatPaper.aiChatPaper

Крошечная Aya: Преодолевая разрыв в масштабе и многоязычной глубине

Tiny Aya: Bridging Scale and Multilingual Depth

March 12, 2026
Авторы: Alejandro R. Salamanca, Diana Abagyan, Daniel D'souza, Ammar Khairi, David Mora, Saurabh Dash, Viraat Aryabumi, Sara Rajaee, Mehrnaz Mofakhami, Ananya Sahu, Thomas Euyang, Brittawnya Prince, Madeline Smith, Hangyu Lin, Acyr Locatelli, Sara Hooker, Tom Kocmi, Aidan Gomez, Ivan Zhang, Phil Blunsom, Nick Frosst, Joelle Pineau, Beyza Ermis, Ahmet Üstün, Julia Kreutzer, Marzieh Fadaee
cs.AI

Аннотация

Модель Tiny Aya переопределяет возможности компактных многоязычных языковых моделей. Обученная на 70 языках и дообученная с учетом региональных особенностей, она демонстрирует передовое качество перевода, мощное многоязычное понимание и генерацию текстов высокого качества на целевом языке, имея всего 3.35 миллиарда параметров. В выпуск вошли предобученная базовая модель, глобально сбалансированная версия, настроенная на инструкции, и три регионально-специализированные модели для языков Африки, Южной Азии, Европы, Азиатско-Тихоокеанского региона и Западной Азии. В данном отчете детально описываются стратегия обучения, состав данных и комплексная система оценки Tiny Aya, а также предлагается альтернативный путь масштабирования многоязычного ИИ, ориентированный на эффективность, сбалансированную производительность для разных языков и практическое развертывание.
English
Tiny Aya redefines what a small multilingual language model can achieve. Trained on 70 languages and refined through region-aware posttraining, it delivers state-of-the-art in translation quality, strong multilingual understanding, and high-quality target-language generation, all with just 3.35B parameters. The release includes a pretrained foundation model, a globally balanced instruction-tuned variant, and three region-specialized models targeting languages from Africa, South Asia, Europe, Asia-Pacific, and West Asia. This report details the training strategy, data composition, and comprehensive evaluation framework behind Tiny Aya, and presents an alternative scaling path for multilingual AI: one centered on efficiency, balanced performance across languages, and practical deployment.
PDF41March 15, 2026