Um modelo de linguagem grande adaptado facilita várias tarefas médicas no cuidado de diabetes.
An adapted large language model facilitates multiple medical tasks in diabetes care
September 20, 2024
Autores: Lai Wei, Zhen Ying, Muyang He, Yutong Chen, Qian Yang, Yanzhe Hong, Jiaping Lu, Xiaoying Li, Weiran Huang, Ying Chen
cs.AI
Resumo
A diabetes é uma doença crônica que representa um significativo fardo para a saúde global, e otimizar o manejo da diabetes requer colaboração entre múltiplos intervenientes. Modelos de linguagem de grande escala (LLMs) têm demonstrado promessa em vários cenários de saúde, mas sua eficácia em uma ampla gama de tarefas relacionadas à diabetes ainda não foi comprovada. Neste estudo, introduzimos um framework para treinar e validar LLMs específicos para diabetes. Primeiramente, desenvolvemos um pipeline abrangente de processamento de dados que inclui coleta, filtragem, aumento e refinamento de dados. Esta abordagem contribui para a criação de um conjunto de dados específico para diabetes de alta qualidade, e diversos benchmarks de avaliação completamente do zero. Utilizando o conjunto de dados de treinamento coletado, refinamos um conjunto de LLMs específicos para diabetes que demonstraram proficiência de ponta na compreensão e processamento de várias tarefas relacionadas à diabetes em comparação com outros LLMs. Além disso, estudos clínicos mostraram as potenciais aplicações de nossos modelos no cuidado da diabetes, incluindo fornecer assistência médica personalizada, auxiliar na educação médica e otimizar tarefas clínicas. Em conclusão, nosso estudo introduziu um framework para desenvolver e avaliar uma família de LLMs específicos para diabetes, e destacou seu potencial para aprimorar a prática clínica e fornecer suporte personalizado e baseado em dados para a diabetes ao lidar com diferentes usuários finais. O código está disponível via GitHub em https://github.com/waltonfuture/Diabetica.
English
Diabetes is a chronic disease that poses a significant global health burden,
and optimizing diabetes management requires multi-stakeholder collaboration.
Large language models (LLMs) have shown promise in various healthcare
scenarios, but their effectiveness across a diverse range of diabetes tasks
remains unproven. In this study, we introduced a framework to train and
validate diabetes-specific LLMs. We first developed a comprehensive data
processing pipeline that includes data collection, filtering, augmentation and
refinement. This approach contributes to creating a high-quality,
diabetes-specific dataset, and several evaluation benchmarks entirely from
scratch. Utilizing the collected training dataset, we fine-tuned a
diabetes-specific LLM family that demonstrated state-of-the-art proficiency in
understanding and processing various diabetes tasks compared to other LLMs.
Furthermore, clinical studies showed the potential applications of our models
in diabetes care, including providing personalized healthcare, assisting
medical education, and streamlining clinical tasks. In conclusion, our study
introduced a framework to develop and evaluate a diabetes-specific LLM family,
and highlighted its potential to enhance clinical practice and provide
personalized, data-driven support for diabetes support when facing different
end users. The code is provided via GitHub at
https://github.com/waltonfuture/Diabetica.Summary
AI-Generated Summary