ChatPaper.aiChatPaper

Un modelo de lenguaje grande adaptado facilita múltiples tareas médicas en el cuidado de la diabetes.

An adapted large language model facilitates multiple medical tasks in diabetes care

September 20, 2024
Autores: Lai Wei, Zhen Ying, Muyang He, Yutong Chen, Qian Yang, Yanzhe Hong, Jiaping Lu, Xiaoying Li, Weiran Huang, Ying Chen
cs.AI

Resumen

La diabetes es una enfermedad crónica que representa una carga significativa para la salud global, y optimizar el manejo de la diabetes requiere colaboración entre múltiples partes interesadas. Los modelos de lenguaje grandes (LLMs, por sus siglas en inglés) han mostrado promesa en varios escenarios de atención médica, pero su efectividad en una amplia gama de tareas relacionadas con la diabetes aún no ha sido comprobada. En este estudio, presentamos un marco para entrenar y validar LLMs específicos para la diabetes. En primer lugar, desarrollamos un completo proceso de procesamiento de datos que incluye la recolección, filtrado, aumento y refinamiento de datos. Este enfoque contribuye a la creación de un conjunto de datos específico para la diabetes de alta calidad, y varios puntos de referencia de evaluación completamente desde cero. Utilizando el conjunto de datos de entrenamiento recolectado, ajustamos finamente una familia de LLMs específicos para la diabetes que demostró competencia de vanguardia en la comprensión y procesamiento de diversas tareas relacionadas con la diabetes en comparación con otros LLMs. Además, estudios clínicos mostraron las posibles aplicaciones de nuestros modelos en el cuidado de la diabetes, incluida la provisión de atención médica personalizada, asistencia en la educación médica y simplificación de tareas clínicas. En conclusión, nuestro estudio presentó un marco para desarrollar y evaluar una familia de LLMs específicos para la diabetes, y destacó su potencial para mejorar la práctica clínica y proporcionar apoyo personalizado basado en datos para la diabetes al enfrentar diferentes usuarios finales. El código está disponible en GitHub en https://github.com/waltonfuture/Diabetica.
English
Diabetes is a chronic disease that poses a significant global health burden, and optimizing diabetes management requires multi-stakeholder collaboration. Large language models (LLMs) have shown promise in various healthcare scenarios, but their effectiveness across a diverse range of diabetes tasks remains unproven. In this study, we introduced a framework to train and validate diabetes-specific LLMs. We first developed a comprehensive data processing pipeline that includes data collection, filtering, augmentation and refinement. This approach contributes to creating a high-quality, diabetes-specific dataset, and several evaluation benchmarks entirely from scratch. Utilizing the collected training dataset, we fine-tuned a diabetes-specific LLM family that demonstrated state-of-the-art proficiency in understanding and processing various diabetes tasks compared to other LLMs. Furthermore, clinical studies showed the potential applications of our models in diabetes care, including providing personalized healthcare, assisting medical education, and streamlining clinical tasks. In conclusion, our study introduced a framework to develop and evaluate a diabetes-specific LLM family, and highlighted its potential to enhance clinical practice and provide personalized, data-driven support for diabetes support when facing different end users. The code is provided via GitHub at https://github.com/waltonfuture/Diabetica.

Summary

AI-Generated Summary

PDF82November 16, 2024