AdditiveLLM2 : Un grand modèle de langage multimodal pour la fabrication additive

Résumé

Ce travail présente AdditiveLLM2, un grand modèle de langage multimodal et adapté au domaine, construit à partir de la variante ajustée aux instructions du modèle Gemma 3 en utilisant un jeu de données relativement petit d'environ 50 millions de tokens. Le jeu de données (AdditiveLLM2-OA) est constitué d'articles de revues en accès libre sur la fabrication additive, dont les données ont été extraites pour les processus de pré-entraînement adaptatif au domaine et de réglage par instructions visuelles. Les différentes étapes du modèle développé sont évaluées avec l'Additive-Manufacturing-Benchmark, qui comprend des tâches spécifiques au domaine de la fabrication additive compilées à partir de ressources publiées. AdditiveLLM2 démontre des compétences dans les tâches basées sur le langage et sur la vision, atteignant des précisions supérieures à 90 % pour les connaissances générales en fabrication additive. Cette stratégie de pré-entraînement adaptatif au domaine et de réglage par instructions décrit une méthode de spécialisation accessible pour les grands modèles de langage appliqués à un domaine tel que la fabrication additive.

English

This work presents AdditiveLLM2 a multi-modal, domain adapted large language model built upon the instruction tuned variant of the Gemma 3 model using a relatively small dataset of around 50 million tokens. The dataset (AdditiveLLM2-OA) consists of open-access additive manufacturing journal articles with data extracted for the domain adaptive pretraining and visual instruction tuning processes. Various stages of the developed model are evaluated with the Additive-Manufacturing-Benchmark which consists of additive manufacturing domain specific tasks compiled published resources. AdditiveLLM2 exhibits proficiency in both language and vision based tasks, achieving accuracies upwards of 90% in general additive manufacturing knowledge. This domain adaptive pretraining and instruction tuning strategy outline an accessible specialization method for large language models to a domain such as additive manufacturing.

AdditiveLLM2 : Un grand modèle de langage multimodal pour la fabrication additive

AdditiveLLM2: A Multi-modal Large Language Model for Additive Manufacturing

Résumé

Support