Een aangepast groot taalmodel vergemakkelijkt meerdere medische taken in diabeteszorg.
An adapted large language model facilitates multiple medical tasks in diabetes care
September 20, 2024
Auteurs: Lai Wei, Zhen Ying, Muyang He, Yutong Chen, Qian Yang, Yanzhe Hong, Jiaping Lu, Xiaoying Li, Weiran Huang, Ying Chen
cs.AI
Samenvatting
Diabetes is een chronische ziekte die een aanzienlijke wereldwijde gezondheidslast met zich meebrengt, en het optimaliseren van diabetesmanagement vereist samenwerking tussen meerdere belanghebbenden. Grote taalmodellen (GTM's) hebben veelbelovende resultaten laten zien in verschillende gezondheidsscenario's, maar hun effectiviteit bij een divers scala aan diabetes taken is nog niet bewezen. In deze studie hebben we een kader geïntroduceerd om diabetes-specifieke GTM's te trainen en valideren. We hebben eerst een uitgebreide gegevensverwerkingspijplijn ontwikkeld die gegevensverzameling, filtering, augmentatie en verfijning omvat. Deze aanpak draagt bij aan het creëren van een hoogwaardige, diabetes-specifiek dataset en diverse evaluatiebenchmarks volledig vanaf nul. Door gebruik te maken van de verzamelde trainingsdataset hebben we een diabetes-specifieke GTM-familie fijnafgestemd die een state-of-the-art bekwaamheid aantoonde in het begrijpen en verwerken van verschillende diabetes taken in vergelijking met andere GTM's. Bovendien toonden klinische studies de potentiële toepassingen van onze modellen in diabeteszorg, waaronder het bieden van gepersonaliseerde gezondheidszorg, het ondersteunen van medisch onderwijs en het stroomlijnen van klinische taken. Ter conclusie heeft onze studie een kader geïntroduceerd om een diabetes-specifieke GTM-familie te ontwikkelen en evalueren, en benadrukte het potentieel om de klinische praktijk te verbeteren en gepersonaliseerde, op data gebaseerde ondersteuning te bieden voor diabeteszorg bij verschillende eindgebruikers. De code is beschikbaar via GitHub op https://github.com/waltonfuture/Diabetica.
English
Diabetes is a chronic disease that poses a significant global health burden,
and optimizing diabetes management requires multi-stakeholder collaboration.
Large language models (LLMs) have shown promise in various healthcare
scenarios, but their effectiveness across a diverse range of diabetes tasks
remains unproven. In this study, we introduced a framework to train and
validate diabetes-specific LLMs. We first developed a comprehensive data
processing pipeline that includes data collection, filtering, augmentation and
refinement. This approach contributes to creating a high-quality,
diabetes-specific dataset, and several evaluation benchmarks entirely from
scratch. Utilizing the collected training dataset, we fine-tuned a
diabetes-specific LLM family that demonstrated state-of-the-art proficiency in
understanding and processing various diabetes tasks compared to other LLMs.
Furthermore, clinical studies showed the potential applications of our models
in diabetes care, including providing personalized healthcare, assisting
medical education, and streamlining clinical tasks. In conclusion, our study
introduced a framework to develop and evaluate a diabetes-specific LLM family,
and highlighted its potential to enhance clinical practice and provide
personalized, data-driven support for diabetes support when facing different
end users. The code is provided via GitHub at
https://github.com/waltonfuture/Diabetica.Summary
AI-Generated Summary