Un modello di linguaggio di grandi dimensioni adattato agevola molteplici compiti medici nella cura del diabete
An adapted large language model facilitates multiple medical tasks in diabetes care
September 20, 2024
Autori: Lai Wei, Zhen Ying, Muyang He, Yutong Chen, Qian Yang, Yanzhe Hong, Jiaping Lu, Xiaoying Li, Weiran Huang, Ying Chen
cs.AI
Abstract
Il diabete è una malattia cronica che rappresenta un significativo onere per la salute globale, e ottimizzare la gestione del diabete richiede una collaborazione multi-stakeholder. I grandi modelli linguistici (LLM) hanno mostrato promesse in vari scenari sanitari, ma la loro efficacia in una vasta gamma di compiti legati al diabete rimane da dimostrare. In questo studio, abbiamo introdotto un framework per addestrare e convalidare LLM specifici per il diabete. Abbiamo prima sviluppato un completo processo di elaborazione dei dati che include raccolta, filtraggio, ampliamento e raffinamento dei dati. Questo approccio contribuisce alla creazione di un dataset di alta qualità specifico per il diabete e diversi benchmark di valutazione completamente da zero. Sfruttando il dataset di addestramento raccolto, abbiamo perfezionato una famiglia di LLM specifici per il diabete che ha dimostrato competenza all'avanguardia nella comprensione e nell'elaborazione di vari compiti legati al diabete rispetto ad altri LLM. Inoltre, studi clinici hanno mostrato le potenziali applicazioni dei nostri modelli nella cura del diabete, inclusa la fornitura di assistenza sanitaria personalizzata, il supporto all'educazione medica e la semplificazione dei compiti clinici. In conclusione, il nostro studio ha introdotto un framework per sviluppare e valutare una famiglia di LLM specifici per il diabete, evidenziando il suo potenziale per migliorare la pratica clinica e fornire supporto personalizzato basato sui dati per il diabete quando si affrontano diversi utenti finali. Il codice è disponibile su GitHub all'indirizzo https://github.com/waltonfuture/Diabetica.
English
Diabetes is a chronic disease that poses a significant global health burden,
and optimizing diabetes management requires multi-stakeholder collaboration.
Large language models (LLMs) have shown promise in various healthcare
scenarios, but their effectiveness across a diverse range of diabetes tasks
remains unproven. In this study, we introduced a framework to train and
validate diabetes-specific LLMs. We first developed a comprehensive data
processing pipeline that includes data collection, filtering, augmentation and
refinement. This approach contributes to creating a high-quality,
diabetes-specific dataset, and several evaluation benchmarks entirely from
scratch. Utilizing the collected training dataset, we fine-tuned a
diabetes-specific LLM family that demonstrated state-of-the-art proficiency in
understanding and processing various diabetes tasks compared to other LLMs.
Furthermore, clinical studies showed the potential applications of our models
in diabetes care, including providing personalized healthcare, assisting
medical education, and streamlining clinical tasks. In conclusion, our study
introduced a framework to develop and evaluate a diabetes-specific LLM family,
and highlighted its potential to enhance clinical practice and provide
personalized, data-driven support for diabetes support when facing different
end users. The code is provided via GitHub at
https://github.com/waltonfuture/Diabetica.Summary
AI-Generated Summary