ChatPaper.aiChatPaper

Un modèle de langage de grande taille adapté facilite plusieurs tâches médicales dans les soins du diabète.

An adapted large language model facilitates multiple medical tasks in diabetes care

September 20, 2024
Auteurs: Lai Wei, Zhen Ying, Muyang He, Yutong Chen, Qian Yang, Yanzhe Hong, Jiaping Lu, Xiaoying Li, Weiran Huang, Ying Chen
cs.AI

Résumé

Le diabète est une maladie chronique qui représente un fardeau important pour la santé mondiale, et l'optimisation de la gestion du diabète nécessite une collaboration entre plusieurs parties prenantes. Les grands modèles de langage (LLM) ont montré des promesses dans divers scénarios de soins de santé, mais leur efficacité dans une gamme variée de tâches liées au diabète reste à prouver. Dans cette étude, nous avons introduit un cadre pour former et valider des LLM spécifiques au diabète. Nous avons d'abord développé un pipeline complet de traitement des données comprenant la collecte, le filtrage, l'augmentation et le raffinement des données. Cette approche contribue à la création d'un ensemble de données spécifique au diabète de haute qualité, ainsi que de plusieurs référentiels d'évaluation entièrement à partir de zéro. En utilisant l'ensemble de données d'entraînement collecté, nous avons affiné une famille de LLM spécifiques au diabète qui a démontré une compétence de pointe dans la compréhension et le traitement de diverses tâches liées au diabète par rapport à d'autres LLM. De plus, des études cliniques ont montré les applications potentielles de nos modèles dans les soins du diabète, notamment en fournissant des soins de santé personnalisés, en aidant à l'éducation médicale et en rationalisant les tâches cliniques. En conclusion, notre étude a introduit un cadre pour développer et évaluer une famille de LLM spécifiques au diabète, et a souligné son potentiel pour améliorer la pratique clinique et fournir un soutien personnalisé et basé sur les données pour le diabète face à différents utilisateurs finaux. Le code est disponible sur GitHub à l'adresse https://github.com/waltonfuture/Diabetica.
English
Diabetes is a chronic disease that poses a significant global health burden, and optimizing diabetes management requires multi-stakeholder collaboration. Large language models (LLMs) have shown promise in various healthcare scenarios, but their effectiveness across a diverse range of diabetes tasks remains unproven. In this study, we introduced a framework to train and validate diabetes-specific LLMs. We first developed a comprehensive data processing pipeline that includes data collection, filtering, augmentation and refinement. This approach contributes to creating a high-quality, diabetes-specific dataset, and several evaluation benchmarks entirely from scratch. Utilizing the collected training dataset, we fine-tuned a diabetes-specific LLM family that demonstrated state-of-the-art proficiency in understanding and processing various diabetes tasks compared to other LLMs. Furthermore, clinical studies showed the potential applications of our models in diabetes care, including providing personalized healthcare, assisting medical education, and streamlining clinical tasks. In conclusion, our study introduced a framework to develop and evaluate a diabetes-specific LLM family, and highlighted its potential to enhance clinical practice and provide personalized, data-driven support for diabetes support when facing different end users. The code is provided via GitHub at https://github.com/waltonfuture/Diabetica.

Summary

AI-Generated Summary

PDF82November 16, 2024