Test-Time-Adaption für EEG-Foundation-Modelle: Eine systematische Untersuchung unter realen Verteilungsverschiebungen

Zusammenfassung

Grundmodelle für Elektroenzephalographie (EEG) haben ein großes Potenzial gezeigt, um generalisierbare Repräsentationen aus umfangreichen neurologischen Daten zu lernen. Ihre klinische Anwendung wird jedoch durch Verteilungsverschiebungen zwischen verschiedenen klinischen Umgebungen, Geräten und Populationen behindert. Testzeit-Anpassung (Test-Time Adaptation, TTA) bietet eine vielversprechende Lösung, indem sie Modellen ermöglicht, sich während der Inferenz an unmarkierte Zieldaten anzupassen, ohne auf die Quelldaten zugreifen zu müssen – eine wertvolle Eigenschaft in Gesundheitssystemen, die durch Datenschutzvorschriften und begrenzte markierte Daten eingeschränkt sind. Ihre Wirksamkeit für EEG ist jedoch weitgehend unerforscht. In dieser Arbeit stellen wir NeuroAdapt-Bench vor, einen systematischen Benchmark zur Bewertung von Testzeit-Anpassungsmethoden für EEG-Grundmodelle unter realistischen Verteilungsverschiebungen. Wir evaluieren repräsentative TTA-Ansätze aus anderen Domänen über mehrere vortrainierte Grundmodelle, verschiedene Downstream-Aufgaben und heterogene Datensätze hinweg, die In-Distribution-, Out-of-Distribution- und extreme Modalitätsverschiebungen (z. B. Ear-EEG) abdecken. Unsere Ergebnisse zeigen, dass Standard-TTA-Methoden inkonsistente Verbesserungen bringen und die Leistung oft sogar verschlechtern, wobei gradientenbasierte Ansätze besonders anfällig für starke Leistungseinbußen sind. Im Gegensatz dazu zeigen optimierungsfreie Methoden eine größere Stabilität und zuverlässigere Verbesserungen. Diese Ergebnisse verdeutlichen die Grenzen bestehender TTA-Techniken für EEG, liefern Orientierungshilfen für die zukünftige Entwicklung und unterstreichen die Notwendigkeit domainspezifischer Anpassungsstrategien.

English

Electroencephalography (EEG) foundation models have shown strong potential for learning generalizable representations from large-scale neural data, yet their clinical deployment is hindered by distribution shifts across clinical settings, devices, and populations. Test-time adaptation (TTA) offers a promising solution by enabling models to adapt to unlabeled target data during inference without access to source data, a valuable property in healthcare settings constrained by privacy regulations and limited labeled data. However, its effectiveness for EEG remains largely underexplored. In this work, we introduce NeuroAdapt-Bench, a systematic benchmark for evaluating test-time adaptation methods on EEG foundation models under realistic distribution shifts. We evaluate representative TTA approaches from other domains across multiple pretrained foundation models, diverse downstream tasks, and heterogeneous datasets spanning in-distribution, out-of-distribution, and extreme modality shifts (e.g., Ear-EEG). Our results show that standard TTA methods yield inconsistent gains and often degrade performance, with gradient-based approaches particularly prone to heavy degradation. In contrast, optimization-free methods demonstrate greater stability and more reliable improvements. These findings highlight the limitations of existing TTA techniques in EEG, provide guidance for future development, and underscore the need for domain-specific adaptation strategies.

Test-Time-Adaption für EEG-Foundation-Modelle: Eine systematische Untersuchung unter realen Verteilungsverschiebungen

Test-Time Adaptation for EEG Foundation Models: A Systematic Study under Real-World Distribution Shifts

Zusammenfassung

Support