Адаптированная большая модель языка облегчает выполнение нескольких медицинских задач в уходе за диабетом.
An adapted large language model facilitates multiple medical tasks in diabetes care
September 20, 2024
Авторы: Lai Wei, Zhen Ying, Muyang He, Yutong Chen, Qian Yang, Yanzhe Hong, Jiaping Lu, Xiaoying Li, Weiran Huang, Ying Chen
cs.AI
Аннотация
Диабет - это хроническое заболевание, которое представляет собой значительную глобальную нагрузку на здоровье, и оптимизация управления диабетом требует сотрудничества между множеством заинтересованных сторон. Большие языковые модели (LLM) показали перспективы в различных сценариях здравоохранения, но их эффективность в различных задачах по диабету остается неподтвержденной. В данном исследовании мы представили фреймворк для обучения и валидации диабетоспецифических LLM. Сначала мы разработали комплексный конвейер обработки данных, включающий сбор, фильтрацию, аугментацию и усовершенствование данных. Этот подход способствует созданию высококачественного диабетоспецифического набора данных и нескольких оценочных бенчмарков с нуля. Используя собранный набор данных для обучения, мы провели донастройку семейства диабетоспецифических LLM, которые продемонстрировали передовую компетентность в понимании и обработке различных задач по диабету по сравнению с другими LLM. Более того, клинические исследования показали потенциальные применения наших моделей в уходе за диабетом, включая предоставление персонализированного здравоохранения, помощь в медицинском образовании и оптимизацию клинических задач. В заключение, наше исследование представило фреймворк для разработки и оценки семейства диабетоспецифических LLM и выделило их потенциал для улучшения клинической практики и предоставления персонализированной, данных-ориентированной поддержки при столкновении с различными конечными пользователями. Код предоставлен через GitHub по адресу https://github.com/waltonfuture/Diabetica.
English
Diabetes is a chronic disease that poses a significant global health burden,
and optimizing diabetes management requires multi-stakeholder collaboration.
Large language models (LLMs) have shown promise in various healthcare
scenarios, but their effectiveness across a diverse range of diabetes tasks
remains unproven. In this study, we introduced a framework to train and
validate diabetes-specific LLMs. We first developed a comprehensive data
processing pipeline that includes data collection, filtering, augmentation and
refinement. This approach contributes to creating a high-quality,
diabetes-specific dataset, and several evaluation benchmarks entirely from
scratch. Utilizing the collected training dataset, we fine-tuned a
diabetes-specific LLM family that demonstrated state-of-the-art proficiency in
understanding and processing various diabetes tasks compared to other LLMs.
Furthermore, clinical studies showed the potential applications of our models
in diabetes care, including providing personalized healthcare, assisting
medical education, and streamlining clinical tasks. In conclusion, our study
introduced a framework to develop and evaluate a diabetes-specific LLM family,
and highlighted its potential to enhance clinical practice and provide
personalized, data-driven support for diabetes support when facing different
end users. The code is provided via GitHub at
https://github.com/waltonfuture/Diabetica.Summary
AI-Generated Summary