適応された大規模言語モデルは、糖尿病ケアにおける複数の医療タスクを支援します。
An adapted large language model facilitates multiple medical tasks in diabetes care
September 20, 2024
著者: Lai Wei, Zhen Ying, Muyang He, Yutong Chen, Qian Yang, Yanzhe Hong, Jiaping Lu, Xiaoying Li, Weiran Huang, Ying Chen
cs.AI
要旨
糖尿病は重大な世界的な健康負担をもたらす慢性疾患であり、糖尿病管理の最適化には複数の利害関係者の協力が必要です。大規模言語モデル(LLMs)はさまざまな医療シナリオで有望な成果を示していますが、多様な糖尿病タスクにおける効果は未確認です。本研究では、糖尿病特化のLLMを訓練および検証するためのフレームワークを紹介しました。まず、データ収集、フィルタリング、拡張、および改良を含む包括的なデータ処理パイプラインを開発しました。このアプローチは、高品質の糖尿病特化データセットおよびいくつかの評価基準をゼロから作成するのに貢献します。収集した訓練データセットを活用して、他のLLMsと比較してさまざまな糖尿病タスクの理解と処理において最先端の能力を示す糖尿病特化LLMファミリーを微調整しました。さらに、臨床研究では、当社のモデルが個別化された医療の提供、医療教育の支援、および臨床タスクの効率化など、糖尿病ケアにおける潜在的な応用を示しました。結論として、本研究は糖尿病特化LLMファミリーを開発および評価するためのフレームワークを紹介し、臨床実践の向上と、異なるエンドユーザーに対応する際の糖尿病サポートのための個別化されたデータ駆動型サポートの可能性を強調しました。コードはGitHubで提供されています:https://github.com/waltonfuture/Diabetica.
English
Diabetes is a chronic disease that poses a significant global health burden,
and optimizing diabetes management requires multi-stakeholder collaboration.
Large language models (LLMs) have shown promise in various healthcare
scenarios, but their effectiveness across a diverse range of diabetes tasks
remains unproven. In this study, we introduced a framework to train and
validate diabetes-specific LLMs. We first developed a comprehensive data
processing pipeline that includes data collection, filtering, augmentation and
refinement. This approach contributes to creating a high-quality,
diabetes-specific dataset, and several evaluation benchmarks entirely from
scratch. Utilizing the collected training dataset, we fine-tuned a
diabetes-specific LLM family that demonstrated state-of-the-art proficiency in
understanding and processing various diabetes tasks compared to other LLMs.
Furthermore, clinical studies showed the potential applications of our models
in diabetes care, including providing personalized healthcare, assisting
medical education, and streamlining clinical tasks. In conclusion, our study
introduced a framework to develop and evaluate a diabetes-specific LLM family,
and highlighted its potential to enhance clinical practice and provide
personalized, data-driven support for diabetes support when facing different
end users. The code is provided via GitHub at
https://github.com/waltonfuture/Diabetica.Summary
AI-Generated Summary