Ein angepasstes großes Sprachmodell erleichtert mehrere medizinische Aufgaben in der Diabetesversorgung.
An adapted large language model facilitates multiple medical tasks in diabetes care
September 20, 2024
Autoren: Lai Wei, Zhen Ying, Muyang He, Yutong Chen, Qian Yang, Yanzhe Hong, Jiaping Lu, Xiaoying Li, Weiran Huang, Ying Chen
cs.AI
Zusammenfassung
Diabetes ist eine chronische Krankheit, die eine bedeutende globale Gesundheitsbelastung darstellt, und die Optimierung des Diabetesmanagements erfordert eine Zusammenarbeit mehrerer Interessensgruppen. Große Sprachmodelle (LLMs) haben in verschiedenen Gesundheitsszenarien vielversprechende Ergebnisse gezeigt, aber ihre Wirksamkeit bei einer Vielzahl von Diabetesaufgaben ist noch nicht nachgewiesen. In dieser Studie haben wir einen Rahmen eingeführt, um diabetes-spezifische LLMs zu trainieren und zu validieren. Zunächst haben wir eine umfassende Datenverarbeitungspipeline entwickelt, die Datensammlung, Filterung, Erweiterung und Verfeinerung umfasst. Dieser Ansatz trägt zur Erstellung eines hochwertigen, diabetes-spezifischen Datensatzes und mehrerer Evaluierungskennzahlen komplett von Grund auf bei. Unter Verwendung des gesammelten Trainingsdatensatzes haben wir eine diabetes-spezifische LLM-Familie feinabgestimmt, die im Vergleich zu anderen LLMs eine Spitzenleistung bei der Verarbeitung verschiedener Diabetesaufgaben zeigte. Darüber hinaus zeigten klinische Studien das Potenzial unserer Modelle in der Diabetesversorgung, einschließlich der Bereitstellung personalisierter Gesundheitsversorgung, der Unterstützung medizinischer Ausbildung und der Optimierung klinischer Aufgaben. Zusammenfassend haben wir in unserer Studie einen Rahmen vorgestellt, um eine diabetes-spezifische LLM-Familie zu entwickeln und zu bewerten, und deren Potenzial zur Verbesserung der klinischen Praxis und Bereitstellung personalisierter, datengesteuerter Unterstützung für Diabetespatienten bei verschiedenen Endbenutzern hervorgehoben. Der Code ist über GitHub unter https://github.com/waltonfuture/Diabetica verfügbar.
English
Diabetes is a chronic disease that poses a significant global health burden,
and optimizing diabetes management requires multi-stakeholder collaboration.
Large language models (LLMs) have shown promise in various healthcare
scenarios, but their effectiveness across a diverse range of diabetes tasks
remains unproven. In this study, we introduced a framework to train and
validate diabetes-specific LLMs. We first developed a comprehensive data
processing pipeline that includes data collection, filtering, augmentation and
refinement. This approach contributes to creating a high-quality,
diabetes-specific dataset, and several evaluation benchmarks entirely from
scratch. Utilizing the collected training dataset, we fine-tuned a
diabetes-specific LLM family that demonstrated state-of-the-art proficiency in
understanding and processing various diabetes tasks compared to other LLMs.
Furthermore, clinical studies showed the potential applications of our models
in diabetes care, including providing personalized healthcare, assisting
medical education, and streamlining clinical tasks. In conclusion, our study
introduced a framework to develop and evaluate a diabetes-specific LLM family,
and highlighted its potential to enhance clinical practice and provide
personalized, data-driven support for diabetes support when facing different
end users. The code is provided via GitHub at
https://github.com/waltonfuture/Diabetica.Summary
AI-Generated Summary