Los modelos base de patología actuales no son robustos ante las diferencias entre centros médicos.

Resumen

Los Modelos Fundamentales de Patología (FMs, por sus siglas en inglés) tienen un gran potencial para la atención médica. Antes de que puedan ser utilizados en la práctica clínica, es esencial asegurar que sean robustos ante las variaciones entre centros médicos. Medimos si los FMs de patología se centran en características biológicas como el tejido y el tipo de cáncer, o en las conocidas firmas confusas de los centros médicos introducidas por el procedimiento de tinción y otras diferencias. Introducimos el Índice de Robustez. Esta métrica de robustez novedosa refleja en qué medida las características biológicas dominan las características confusas. Se evaluaron diez FMs de patología actualmente disponibles públicamente. Descubrimos que todos los modelos fundamentales de patología actuales evaluados representan al centro médico en gran medida. Se observan diferencias significativas en el índice de robustez. Hasta ahora, solo un modelo tiene un índice de robustez mayor que uno, lo que significa que las características biológicas dominan las características confusas, pero solo ligeramente. Se describe un enfoque cuantitativo para medir la influencia de las diferencias entre centros médicos en el rendimiento de predicción basado en FMs. Analizamos el impacto de la falta de robustez en el rendimiento de clasificación de los modelos posteriores, y encontramos que los errores de clasificación del tipo de cáncer no son aleatorios, sino atribuibles específicamente a los factores confusos del mismo centro: imágenes de otras clases del mismo centro médico. Visualizamos los espacios de incrustación de los FMs y encontramos que estos están más fuertemente organizados por centros médicos que por factores biológicos. Como consecuencia, el centro médico de origen se predice con mayor precisión que la fuente de tejido y el tipo de cáncer. El índice de robustez introducido aquí se proporciona con el objetivo de avanzar en el progreso hacia la adopción clínica de FMs de patología robustos y confiables.

English

Pathology Foundation Models (FMs) hold great promise for healthcare. Before they can be used in clinical practice, it is essential to ensure they are robust to variations between medical centers. We measure whether pathology FMs focus on biological features like tissue and cancer type, or on the well known confounding medical center signatures introduced by staining procedure and other differences. We introduce the Robustness Index. This novel robustness metric reflects to what degree biological features dominate confounding features. Ten current publicly available pathology FMs are evaluated. We find that all current pathology foundation models evaluated represent the medical center to a strong degree. Significant differences in the robustness index are observed. Only one model so far has a robustness index greater than one, meaning biological features dominate confounding features, but only slightly. A quantitative approach to measure the influence of medical center differences on FM-based prediction performance is described. We analyze the impact of unrobustness on classification performance of downstream models, and find that cancer-type classification errors are not random, but specifically attributable to same-center confounders: images of other classes from the same medical center. We visualize FM embedding spaces, and find these are more strongly organized by medical centers than by biological factors. As a consequence, the medical center of origin is predicted more accurately than the tissue source and cancer type. The robustness index introduced here is provided with the aim of advancing progress towards clinical adoption of robust and reliable pathology FMs.

Los modelos base de patología actuales no son robustos ante las diferencias entre centros médicos.

Current Pathology Foundation Models are unrobust to Medical Center Differences

Resumen

Support