Адаптированная большая модель языка облегчает выполнение нескольких медицинских задач в уходе за диабетом.

Аннотация

Диабет - это хроническое заболевание, которое представляет собой значительную глобальную нагрузку на здоровье, и оптимизация управления диабетом требует сотрудничества между множеством заинтересованных сторон. Большие языковые модели (LLM) показали перспективы в различных сценариях здравоохранения, но их эффективность в различных задачах по диабету остается неподтвержденной. В данном исследовании мы представили фреймворк для обучения и валидации диабетоспецифических LLM. Сначала мы разработали комплексный конвейер обработки данных, включающий сбор, фильтрацию, аугментацию и усовершенствование данных. Этот подход способствует созданию высококачественного диабетоспецифического набора данных и нескольких оценочных бенчмарков с нуля. Используя собранный набор данных для обучения, мы провели донастройку семейства диабетоспецифических LLM, которые продемонстрировали передовую компетентность в понимании и обработке различных задач по диабету по сравнению с другими LLM. Более того, клинические исследования показали потенциальные применения наших моделей в уходе за диабетом, включая предоставление персонализированного здравоохранения, помощь в медицинском образовании и оптимизацию клинических задач. В заключение, наше исследование представило фреймворк для разработки и оценки семейства диабетоспецифических LLM и выделило их потенциал для улучшения клинической практики и предоставления персонализированной, данных-ориентированной поддержки при столкновении с различными конечными пользователями. Код предоставлен через GitHub по адресу https://github.com/waltonfuture/Diabetica.

English

Diabetes is a chronic disease that poses a significant global health burden, and optimizing diabetes management requires multi-stakeholder collaboration. Large language models (LLMs) have shown promise in various healthcare scenarios, but their effectiveness across a diverse range of diabetes tasks remains unproven. In this study, we introduced a framework to train and validate diabetes-specific LLMs. We first developed a comprehensive data processing pipeline that includes data collection, filtering, augmentation and refinement. This approach contributes to creating a high-quality, diabetes-specific dataset, and several evaluation benchmarks entirely from scratch. Utilizing the collected training dataset, we fine-tuned a diabetes-specific LLM family that demonstrated state-of-the-art proficiency in understanding and processing various diabetes tasks compared to other LLMs. Furthermore, clinical studies showed the potential applications of our models in diabetes care, including providing personalized healthcare, assisting medical education, and streamlining clinical tasks. In conclusion, our study introduced a framework to develop and evaluate a diabetes-specific LLM family, and highlighted its potential to enhance clinical practice and provide personalized, data-driven support for diabetes support when facing different end users. The code is provided via GitHub at https://github.com/waltonfuture/Diabetica.

Адаптированная большая модель языка облегчает выполнение нескольких медицинских задач в уходе за диабетом.

An adapted large language model facilitates multiple medical tasks in diabetes care

Аннотация

Support