Diagnóstico de la gravedad de COVID-19 a partir de imágenes de radiografías de tórax utilizando arquitecturas ViT y CNN
Diagnosing COVID-19 Severity from Chest X-Ray Images Using ViT and CNN Architectures
February 23, 2025
Autores: Luis Lara, Lucia Eve Berger, Rajesh Raju, Shawn Whitfield
cs.AI
Resumen
La pandemia de COVID-19 tensionó los recursos sanitarios y generó discusiones sobre cómo el aprendizaje automático podría aliviar la carga de los médicos y contribuir al diagnóstico. Las radiografías de tórax (CXR, por sus siglas en inglés) se utilizan para diagnosticar COVID-19, pero pocos estudios predicen la gravedad de la condición del paciente a partir de estas. En este estudio, generamos un amplio conjunto de datos sobre la gravedad de COVID-19 al fusionar tres fuentes e investigamos la eficacia del aprendizaje por transferencia utilizando modelos preentrenados en ImageNet y CXR, así como transformadores de visión (ViTs), tanto en tareas de regresión como de clasificación de gravedad. Un modelo DenseNet161 preentrenado obtuvo los mejores resultados en la predicción de gravedad de tres clases, alcanzando un 80% de precisión general y un 77.3%, 83.9% y 70% en casos leves, moderados y graves, respectivamente. El ViT logró los mejores resultados en regresión, con un error absoluto medio de 0.5676 en comparación con las puntuaciones de gravedad predichas por radiólogos. El código fuente del proyecto está disponible públicamente.
English
The COVID-19 pandemic strained healthcare resources and prompted discussion
about how machine learning can alleviate physician burdens and contribute to
diagnosis. Chest x-rays (CXRs) are used for diagnosis of COVID-19, but few
studies predict the severity of a patient's condition from CXRs. In this study,
we produce a large COVID severity dataset by merging three sources and
investigate the efficacy of transfer learning using ImageNet- and
CXR-pretrained models and vision transformers (ViTs) in both severity
regression and classification tasks. A pretrained DenseNet161 model performed
the best on the three class severity prediction problem, reaching 80% accuracy
overall and 77.3%, 83.9%, and 70% on mild, moderate and severe cases,
respectively. The ViT had the best regression results, with a mean absolute
error of 0.5676 compared to radiologist-predicted severity scores. The
project's source code is publicly available.Summary
AI-Generated Summary