Brecha de Generalización de la IA en la Estadificación de Trastornos del Sueño Comórbidos
AI Generalisation Gap In Comorbid Sleep Disorder Staging
March 24, 2026
Autores: Saswata Bose, Suvadeep Maiti, Shivam Kumar Sharma, Mythirayee S, Tapabrata Chakraborti, Srijitesh Rajendran, Raju S. Bapi
cs.AI
Resumen
La clasificación precisa del sueño es esencial para diagnosticar la AOS y la hipopnea en pacientes con ictus. Aunque la PSG es fiable, es costosa, requiere mucha mano de obra y se puntúa manualmente. Si bien el aprendizaje profundo permite la clasificación automatizada del sueño basada en EEG en sujetos sanos, nuestro análisis muestra una pobre generalización a poblaciones clínicas con sueño alterado. Utilizando interpretaciones Grad-CAM, demostramos sistemáticamente esta limitación. Presentamos iSLEEPS, un nuevo conjunto de datos de ictus isquémico anotado clínicamente (que se hará público), y evaluamos un modelo SE-ResNet más LSTM bidireccional para la clasificación del sueño con EEG de un solo canal. Como era de esperar, el rendimiento cross-domain entre sujetos sanos y enfermos es pobre. Las visualizaciones de atención, respaldadas por la retroalimentación de expertos clínicos, muestran que el modelo se centra en regiones EEG fisiológicamente no informativas en los datos de los pacientes. Los análisis estadísticos y computacionales confirman además diferencias significativas en la arquitectura del sueño entre cohortes sanas y con ictus isquémico, destacando la necesidad de modelos conscientes del sujeto o específicos de la enfermedad con validación clínica antes de su implementación. Un resumen del artículo y el código está disponible en https://himalayansaswatabose.github.io/iSLEEPS_Explainability.github.io/.
English
Accurate sleep staging is essential for diagnosing OSA and hypopnea in stroke patients. Although PSG is reliable, it is costly, labor-intensive, and manually scored. While deep learning enables automated EEG-based sleep staging in healthy subjects, our analysis shows poor generalization to clinical populations with disrupted sleep. Using Grad-CAM interpretations, we systematically demonstrate this limitation. We introduce iSLEEPS, a newly clinically annotated ischemic stroke dataset (to be publicly released), and evaluate a SE-ResNet plus bidirectional LSTM model for single-channel EEG sleep staging. As expected, cross-domain performance between healthy and diseased subjects is poor. Attention visualizations, supported by clinical expert feedback, show the model focuses on physiologically uninformative EEG regions in patient data. Statistical and computational analyses further confirm significant sleep architecture differences between healthy and ischemic stroke cohorts, highlighting the need for subject-aware or disease-specific models with clinical validation before deployment. A summary of the paper and the code is available at https://himalayansaswatabose.github.io/iSLEEPS_Explainability.github.io/