Modelo Aya: Un Modelo de Lenguaje Multilingüe de Acceso Abierto Ajustado mediante InstruccionesAya Model: An Instruction Finetuned Open-Access Multilingual Language
Model
Los avances recientes en los modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés) se han centrado en un puñado de idiomas con abundancia de datos. ¿Qué se necesita para ampliar el acceso a estos avances más allá de los idiomas considerados de primera clase? Nuestro trabajo presenta Aya, un modelo generativo de lenguaje masivamente multilingüe que sigue instrucciones en 101 idiomas, de los cuales más del 50% se consideran de recursos limitados. Aya supera a mT0 y BLOOMZ en la mayoría de las tareas, mientras cubre el doble de idiomas. Introdujimos extensas nuevas suites de evaluación que amplían el estado del arte para la evaluación multilingüe en 99 idiomas, incluyendo tareas discriminativas y generativas, evaluación humana y tasas de éxito simuladas que cubren tanto tareas no vistas como el rendimiento dentro de la distribución. Además, realizamos investigaciones detalladas sobre la composición óptima de la mezcla de ajuste fino, la poda de datos, así como la toxicidad, el sesgo y la seguridad de nuestros modelos. Hemos liberado nuestros conjuntos de datos de instrucciones y nuestro modelo en https://hf.co/CohereForAI/aya-101.