AdditiveLLM2: Мультимодальная большая языковая модель для аддитивного производства

Аннотация

В данной работе представлена модель AdditiveLLM2 — многомодальная, адаптированная к предметной области большая языковая модель, построенная на основе инструктивно-дообученного варианта модели Gemma 3 с использованием относительно небольшого набора данных объемом около 50 миллионов токенов. Набор данных (AdditiveLLM2-OA) состоит из статей по аддитивным технологиям с открытым доступом, из которых были извлечены данные для процессов доменной адаптивной предварительной подготовки и визуального инструктивного дообучения. Различные этапы разработанной модели оценивались с помощью Additive-Manufacturing-Benchmark, который включает в себя специализированные задачи для области аддитивного производства, собранные из опубликованных ресурсов. AdditiveLLM2 демонстрирует компетентность как в языковых, так и в визуальных задачах, достигая точности свыше 90% в области общих знаний об аддитивном производстве. Данная стратегия доменной адаптивной предварительной подготовки и инструктивного дообучения описывает доступный метод специализации больших языковых моделей для таких предметных областей, как аддитивное производство.

English

This work presents AdditiveLLM2 a multi-modal, domain adapted large language model built upon the instruction tuned variant of the Gemma 3 model using a relatively small dataset of around 50 million tokens. The dataset (AdditiveLLM2-OA) consists of open-access additive manufacturing journal articles with data extracted for the domain adaptive pretraining and visual instruction tuning processes. Various stages of the developed model are evaluated with the Additive-Manufacturing-Benchmark which consists of additive manufacturing domain specific tasks compiled published resources. AdditiveLLM2 exhibits proficiency in both language and vision based tasks, achieving accuracies upwards of 90% in general additive manufacturing knowledge. This domain adaptive pretraining and instruction tuning strategy outline an accessible specialization method for large language models to a domain such as additive manufacturing.

AdditiveLLM2: Мультимодальная большая языковая модель для аддитивного производства

AdditiveLLM2: A Multi-modal Large Language Model for Additive Manufacturing

Аннотация

Support