Tabellarische LLMs für interpretierbare Vorhersage von Alzheimer mit wenigen Beispielen unter Verwendung multimodaler biomedizinischer Daten
Tabular LLMs for Interpretable Few-Shot Alzheimer's Disease Prediction with Multimodal Biomedical Data
March 17, 2026
Autoren: Sophie Kearney, Shu Yang, Zixuan Wen, Weimin Lyu, Bojian Hou, Duy Duong-Tran, Tianlong Chen, Jason H. Moore, Marylyn D. Ritchie, Chao Chen, Li Shen
cs.AI
Zusammenfassung
Eine genaue Diagnose der Alzheimer-Krankheit (AD) erfordert die Verarbeitung tabellarischer Biomarker-Daten, doch sind solche Daten oft klein und unvollständig, wodurch Deep-Learning-Modelle häufig nicht in der Lage sind, klassische Methoden zu übertreffen. Vortrainierte Large Language Models (LLMs) bieten Few-Shot-Generalisation, strukturiertes Denken und interpretierbare Ausgaben und stellen somit eine leistungsstarke Paradigmenverschiebung für die klinische Vorhersage dar. Wir schlagen TAP-GT (Tabular Alzheimer's Prediction GPT) vor, ein domänenadaptiertes tabellarisches LLM-Framework, das auf TableGPT2 aufbaut und für die Few-Shot-AD-Klassifikation mittels tabellarischer Prompts anstelle von Klartexten feinabgestimmt wurde. Wir evaluieren TAP-GT anhand von vier aus ADNI abgeleiteten Datensätzen, einschließlich QT-PAD-Biomarkern sowie strukturellen MRT-, Amyloid-PET- und Tau-PET-Daten auf Regionsebene für die binäre AD-Klassifikation. In multimodalen und unimodalen Settings übertrifft TAP-GT seine Backbone-Modelle und schneidet im Few-Shot-Setting besser ab als traditionelle Machine-Learning-Baselines, bleibt dabei aber wettbewerbsfähig mit state-of-the-art, allgemeinen LLMs. Wir zeigen, dass Merkmalsauswahl eine Verschlechterung bei hochdimensionalen Eingaben abmildert und dass TAP-GT eine stabile Leistung unter simulierten und realen Fehlenden-Werte-Bedingungen ohne Imputation beibehält. Zusätzlich erzeugt TAP-GT strukturierte, modalitätsbewusste Schlussfolgerungen, die mit der etablierten AD-Biologie übereinstimmen, und zeigt eine größere Stabilität unter Selbstreflexion, was seine Verwendung in iterativen Multi-Agenten-Systemen unterstützt. Unseres Wissens ist dies die erste systematische Anwendung eines auf Tabellendaten spezialisierten LLMs für die multimodale, biomarkerbasierte AD-Vorhersage. Sie demonstriert, dass solche vortrainierten Modelle strukturierte klinische Vorhersageaufgaben effektiv bewältigen können, und legt den Grundstein für tabellarische LLM-gesteuerte Multi-Agenten-Systeme zur klinischen Entscheidungsunterstützung. Der Quellcode ist öffentlich auf GitHub verfügbar: https://github.com/sophie-kearney/TAP-GT.
English
Accurate diagnosis of Alzheimer's disease (AD) requires handling tabular biomarker data, yet such data are often small and incomplete, where deep learning models frequently fail to outperform classical methods. Pretrained large language models (LLMs) offer few-shot generalization, structured reasoning, and interpretable outputs, providing a powerful paradigm shift for clinical prediction. We propose TAP-GPT Tabular Alzheimer's Prediction GPT, a domain-adapted tabular LLM framework built on TableGPT2 and fine-tuned for few-shot AD classification using tabular prompts rather than plain texts. We evaluate TAP-GPT across four ADNI-derived datasets, including QT-PAD biomarkers and region-level structural MRI, amyloid PET, and tau PET for binary AD classification. Across multimodal and unimodal settings, TAP-GPT improves upon its backbone models and outperforms traditional machine learning baselines in the few-shot setting while remaining competitive with state-of-the-art general-purpose LLMs. We show that feature selection mitigates degradation in high-dimensional inputs and that TAP-GPT maintains stable performance under simulated and real-world missingness without imputation. Additionally, TAP-GPT produces structured, modality-aware reasoning aligned with established AD biology and shows greater stability under self-reflection, supporting its use in iterative multi-agent systems. To our knowledge, this is the first systematic application of a tabular-specialized LLM to multimodal biomarker-based AD prediction, demonstrating that such pretrained models can effectively address structured clinical prediction tasks and laying the foundation for tabular LLM-driven multi-agent clinical decision-support systems. The source code is publicly available on GitHub: https://github.com/sophie-kearney/TAP-GPT.