Transformerベースのマルチラベルシーケンス分類を用いた自動差動診断
Automatic Differential Diagnosis using Transformer-Based Multi-Label Sequence Classification
August 28, 2024
著者: Abu Adnan Sadi, Mohammad Ashrafuzzaman Khan, Lubaba Binte Saber
cs.AI
要旨
人工知能の分野が進展するにつれ、補助技術はあらゆる産業で広く使用されるようになっています。医療業界も例外ではなく、医療従事者向けの補助ツールを開発するための多くの研究が行われています。自動診断システムは、患者情報の収集、検査結果の分析、患者の診断など、さまざまなタスクを支援する有益なツールの1つです。ただし、異なる診断を提供できるシステムを開発するというアイデアは、これらの研究のほとんどでほとんど見落とされてきました。本研究では、患者の年齢、性別、医療歴、症状に基づいて異なる診断を提供するためのトランスフォーマーベースのアプローチを提案します。我々はDDXPlusデータセットを使用し、49種類の疾患に基づいて患者の異なる診断情報を提供します。まず、データセットからの表形式の患者データを処理し、それらを研究に適した患者レポートにエンジニアリングする方法を提案します。さらに、トレーニングデータを多様化し、モデルの堅牢性を向上させるために2つのデータ修正モジュールを導入します。我々はこのタスクをマルチラベル分類問題として取り組み、4つのトランスフォーマーモデルを使用して包括的な実験を行います。すべてのモデルは、ヘルドアウトテストセットで97%以上のF1スコアを達成することで有望な結果を示しました。さらに、モデルのより広範な理解を得るために追加の行動テストを設計します。特に、1つのテストケースでは、医師の協力を得て100サンプルのカスタムテストセットを準備しました。カスタムセットの結果から、提案されたデータ修正モジュールがモデルの汎化能力を向上させたことが示されました。今回の研究結果が、将来の研究者に有益な示唆を提供し、信頼性のある自動異なる診断システムの開発を促すことを願っています。
English
As the field of artificial intelligence progresses, assistive technologies
are becoming more widely used across all industries. The healthcare industry is
no different, with numerous studies being done to develop assistive tools for
healthcare professionals. Automatic diagnostic systems are one such beneficial
tool that can assist with a variety of tasks, including collecting patient
information, analyzing test results, and diagnosing patients. However, the idea
of developing systems that can provide a differential diagnosis has been
largely overlooked in most of these research studies. In this study, we propose
a transformer-based approach for providing differential diagnoses based on a
patient's age, sex, medical history, and symptoms. We use the DDXPlus dataset,
which provides differential diagnosis information for patients based on 49
disease types. Firstly, we propose a method to process the tabular patient data
from the dataset and engineer them into patient reports to make them suitable
for our research. In addition, we introduce two data modification modules to
diversify the training data and consequently improve the robustness of the
models. We approach the task as a multi-label classification problem and
conduct extensive experiments using four transformer models. All the models
displayed promising results by achieving over 97% F1 score on the held-out test
set. Moreover, we design additional behavioral tests to get a broader
understanding of the models. In particular, for one of our test cases, we
prepared a custom test set of 100 samples with the assistance of a doctor. The
results on the custom set showed that our proposed data modification modules
improved the model's generalization capabilities. We hope our findings will
provide future researchers with valuable insights and inspire them to develop
reliable systems for automatic differential diagnosis.Summary
AI-Generated Summary