ChatPaper.aiChatPaper

Tiny Aya: Conectando Escala e Profundidade Multilíngue

Tiny Aya: Bridging Scale and Multilingual Depth

March 12, 2026
Autores: Alejandro R. Salamanca, Diana Abagyan, Daniel D'souza, Ammar Khairi, David Mora, Saurabh Dash, Viraat Aryabumi, Sara Rajaee, Mehrnaz Mofakhami, Ananya Sahu, Thomas Euyang, Brittawnya Prince, Madeline Smith, Hangyu Lin, Acyr Locatelli, Sara Hooker, Tom Kocmi, Aidan Gomez, Ivan Zhang, Phil Blunsom, Nick Frosst, Joelle Pineau, Beyza Ermis, Ahmet Üstün, Julia Kreutzer, Marzieh Fadaee
cs.AI

Resumo

O Tiny Aya redefine o que um pequeno modelo de linguagem multilíngue pode alcançar. Treinado em 70 idiomas e refinado por meio de um pós-treinamento com consciência regional, ele oferece qualidade de tradução de ponta, forte compreensão multilíngue e geração de alta qualidade no idioma de destino, tudo com apenas 3,35 bilhões de parâmetros. O lançamento inclui um modelo base pré-treinado, uma variante ajustada para instruções com balanceamento global e três modelos especializados por região, voltados para idiomas da África, Sul da Ásia, Europa, Ásia-Pacífico e Ásia Ocidental. Este relatório detalha a estratégia de treinamento, a composição dos dados e a estrutura abrangente de avaliação por trás do Tiny Aya, e apresenta um caminho alternativo de escalonamento para IA multilíngue: um focado em eficiência, desempenho equilibrado entre idiomas e implantação prática.
English
Tiny Aya redefines what a small multilingual language model can achieve. Trained on 70 languages and refined through region-aware posttraining, it delivers state-of-the-art in translation quality, strong multilingual understanding, and high-quality target-language generation, all with just 3.35B parameters. The release includes a pretrained foundation model, a globally balanced instruction-tuned variant, and three region-specialized models targeting languages from Africa, South Asia, Europe, Asia-Pacific, and West Asia. This report details the training strategy, data composition, and comprehensive evaluation framework behind Tiny Aya, and presents an alternative scaling path for multilingual AI: one centered on efficiency, balanced performance across languages, and practical deployment.
PDF71March 29, 2026