ChatPaper.aiChatPaper

Diagnostic différentiel automatique à l'aide de la classification de séquences multi-étiquettes basée sur les transformateurs

Automatic Differential Diagnosis using Transformer-Based Multi-Label Sequence Classification

August 28, 2024
Auteurs: Abu Adnan Sadi, Mohammad Ashrafuzzaman Khan, Lubaba Binte Saber
cs.AI

Résumé

Avec l'avancée de l'intelligence artificielle, les technologies d'assistance sont de plus en plus utilisées dans tous les secteurs. L'industrie de la santé ne fait pas exception, avec de nombreuses études menées pour développer des outils d'assistance pour les professionnels de la santé. Les systèmes de diagnostic automatique sont l'un de ces outils bénéfiques qui peuvent aider dans diverses tâches, notamment la collecte d'informations sur les patients, l'analyse des résultats des tests et le diagnostic des patients. Cependant, l'idée de développer des systèmes capables de fournir un diagnostic différentiel a été largement négligée dans la plupart de ces études de recherche. Dans cette étude, nous proposons une approche basée sur les transformers pour fournir des diagnostics différentiels basés sur l'âge, le sexe, les antécédents médicaux et les symptômes d'un patient. Nous utilisons l'ensemble de données DDXPlus, qui fournit des informations de diagnostic différentiel pour les patients basées sur 49 types de maladies. Tout d'abord, nous proposons une méthode pour traiter les données des patients tabulaires de l'ensemble de données et les transformer en rapports de patients pour les rendre adaptés à notre recherche. De plus, nous introduisons deux modules de modification de données pour diversifier les données d'entraînement et améliorer ainsi la robustesse des modèles. Nous abordons la tâche comme un problème de classification multi-étiquettes et menons des expériences approfondies en utilisant quatre modèles de transformers. Tous les modèles ont affiché des résultats prometteurs en atteignant plus de 97% de score F1 sur l'ensemble de test retenu. De plus, nous concevons des tests comportementaux supplémentaires pour obtenir une compréhension plus large des modèles. En particulier, pour l'un de nos cas de test, nous avons préparé un ensemble de tests personnalisé de 100 échantillons avec l'aide d'un médecin. Les résultats sur l'ensemble personnalisé ont montré que nos modules de modification de données proposés ont amélioré les capacités de généralisation du modèle. Nous espérons que nos découvertes fourniront aux futurs chercheurs des informations précieuses et les inspireront à développer des systèmes fiables pour le diagnostic différentiel automatique.
English
As the field of artificial intelligence progresses, assistive technologies are becoming more widely used across all industries. The healthcare industry is no different, with numerous studies being done to develop assistive tools for healthcare professionals. Automatic diagnostic systems are one such beneficial tool that can assist with a variety of tasks, including collecting patient information, analyzing test results, and diagnosing patients. However, the idea of developing systems that can provide a differential diagnosis has been largely overlooked in most of these research studies. In this study, we propose a transformer-based approach for providing differential diagnoses based on a patient's age, sex, medical history, and symptoms. We use the DDXPlus dataset, which provides differential diagnosis information for patients based on 49 disease types. Firstly, we propose a method to process the tabular patient data from the dataset and engineer them into patient reports to make them suitable for our research. In addition, we introduce two data modification modules to diversify the training data and consequently improve the robustness of the models. We approach the task as a multi-label classification problem and conduct extensive experiments using four transformer models. All the models displayed promising results by achieving over 97% F1 score on the held-out test set. Moreover, we design additional behavioral tests to get a broader understanding of the models. In particular, for one of our test cases, we prepared a custom test set of 100 samples with the assistance of a doctor. The results on the custom set showed that our proposed data modification modules improved the model's generalization capabilities. We hope our findings will provide future researchers with valuable insights and inspire them to develop reliable systems for automatic differential diagnosis.

Summary

AI-Generated Summary

PDF71November 16, 2024