Meltemi: El primer Modelo de Lenguaje Grande abierto para el griegoMeltemi: The first open Large Language Model for Greek
Describimos el desarrollo y las capacidades de Meltemi 7B, el primer Modelo de Lenguaje Grande abierto para el idioma griego. Meltemi 7B tiene 7 mil millones de parámetros y está entrenado en un corpus griego de 40 mil millones de tokens. Para el desarrollo de Meltemi 7B, adaptamos Mistral, mediante un preentrenamiento continuo en el Corpus griego. Meltemi 7B contiene información actualizada hasta septiembre de 2023. Además, hemos traducido y curado un corpus de instrucciones en griego, que se ha utilizado para el ajuste de instrucciones de un modelo de chat, llamado Meltemi 7B Instruct. Se ha prestado especial atención a la alineación y eliminación de contenido tóxico para Meltemi 7B Instruct. Los modelos desarrollados se evalúan en un amplio conjunto de corpora de evaluación recopilados, y se presentan ejemplos de estímulos y respuestas. Tanto Meltemi 7B como Meltemi 7B Instruct están disponibles en https://huggingface.co/ilsp bajo la licencia Apache 2.0.