Diagnóstico Diferencial Automático usando Classificação de Sequência Multi-Rótulo Baseada em Transformer.
Automatic Differential Diagnosis using Transformer-Based Multi-Label Sequence Classification
August 28, 2024
Autores: Abu Adnan Sadi, Mohammad Ashrafuzzaman Khan, Lubaba Binte Saber
cs.AI
Resumo
À medida que o campo da inteligência artificial avança, as tecnologias assistivas estão se tornando mais amplamente utilizadas em todas as indústrias. A indústria da saúde não é exceção, com inúmeros estudos sendo realizados para desenvolver ferramentas assistivas para profissionais de saúde. Sistemas de diagnóstico automático são uma dessas ferramentas benéficas que podem auxiliar em uma variedade de tarefas, incluindo coleta de informações do paciente, análise de resultados de testes e diagnóstico de pacientes. No entanto, a ideia de desenvolver sistemas que possam fornecer um diagnóstico diferencial tem sido amplamente negligenciada na maioria desses estudos de pesquisa. Neste estudo, propomos uma abordagem baseada em transformadores para fornecer diagnósticos diferenciais com base na idade, sexo, histórico médico e sintomas de um paciente. Utilizamos o conjunto de dados DDXPlus, que fornece informações de diagnóstico diferencial para pacientes com base em 49 tipos de doenças. Em primeiro lugar, propomos um método para processar os dados tabulares do paciente do conjunto de dados e transformá-los em relatórios de pacientes para torná-los adequados para nossa pesquisa. Além disso, introduzimos dois módulos de modificação de dados para diversificar os dados de treinamento e, consequentemente, melhorar a robustez dos modelos. Abordamos a tarefa como um problema de classificação multi-rótulo e realizamos experimentos extensivos usando quatro modelos de transformadores. Todos os modelos apresentaram resultados promissores, alcançando mais de 97% de pontuação F1 no conjunto de teste retido. Além disso, projetamos testes comportamentais adicionais para obter uma compreensão mais ampla dos modelos. Em particular, para um de nossos casos de teste, preparamos um conjunto de testes personalizado com 100 amostras com a assistência de um médico. Os resultados no conjunto personalizado mostraram que nossos módulos de modificação de dados propostos melhoraram as capacidades de generalização do modelo. Esperamos que nossas descobertas forneçam insights valiosos para futuros pesquisadores e os inspirem a desenvolver sistemas confiáveis para diagnóstico diferencial automático.
English
As the field of artificial intelligence progresses, assistive technologies
are becoming more widely used across all industries. The healthcare industry is
no different, with numerous studies being done to develop assistive tools for
healthcare professionals. Automatic diagnostic systems are one such beneficial
tool that can assist with a variety of tasks, including collecting patient
information, analyzing test results, and diagnosing patients. However, the idea
of developing systems that can provide a differential diagnosis has been
largely overlooked in most of these research studies. In this study, we propose
a transformer-based approach for providing differential diagnoses based on a
patient's age, sex, medical history, and symptoms. We use the DDXPlus dataset,
which provides differential diagnosis information for patients based on 49
disease types. Firstly, we propose a method to process the tabular patient data
from the dataset and engineer them into patient reports to make them suitable
for our research. In addition, we introduce two data modification modules to
diversify the training data and consequently improve the robustness of the
models. We approach the task as a multi-label classification problem and
conduct extensive experiments using four transformer models. All the models
displayed promising results by achieving over 97% F1 score on the held-out test
set. Moreover, we design additional behavioral tests to get a broader
understanding of the models. In particular, for one of our test cases, we
prepared a custom test set of 100 samples with the assistance of a doctor. The
results on the custom set showed that our proposed data modification modules
improved the model's generalization capabilities. We hope our findings will
provide future researchers with valuable insights and inspire them to develop
reliable systems for automatic differential diagnosis.Summary
AI-Generated Summary