Tabellarische LLM's voor interpreteerbare voorspelling van de ziekte van Alzheimer met weinig voorbeelden met multimodale biomedische gegevens

Samenvatting

Een nauwkeurige diagnose van de ziekte van Alzheimer (AD) vereist de verwerking van tabulaire biomarkerdata, maar dergelijke data zijn vaak beperkt en incompleet, waardoor deep learning-modellen vaak niet beter presteren dan klassieke methoden. Voorgetrainde grote taalmodellen (LLM's) bieden few-shot generalisatie, gestructureerd redeneren en interpreteerbare uitvoer, wat een krachtige paradigmaverschuiving vormt voor klinische voorspelling. Wij presenteren TAP-GPT (Tabular Alzheimer's Prediction GPT), een domeinaangepast tabulair LLM-raamwerk gebaseerd op TableGPT2 en gefinetuned voor few-shot AD-classificatie met behulp van tabulaire prompts in plaats van platte tekst. We evalueren TAP-GPT op vier van ADNI afgeleide datasets, waaronder QT-PAD-biomarkers en regionale structurele MRI, amyloïd-PET en tau-PET voor binaire AD-classificatie. In zowel multimodale als unimodale settings verbetert TAP-GPT ten opzichte van zijn backbone-modellen en overtreft het traditionele machine learning-baselines in de few-shot setting, terwijl het competitief blijft met state-of-the-art algemene LLM's. We tonen aan dat kenmerkselectie degradatie bij hoogdimensionale invoer vermindert en dat TAP-GPT stabiele prestaties behoudt onder gesimuleerde en realistische ontbrekende data zonder imputatie. Bovendien produceert TAP-GPT gestructureerde, modaliteitsbewuste redenering die aansluit bij de gevestigde AD-biologie en vertoont het grotere stabiliteit onder zelfreflectie, wat het gebruik in iteratieve multi-agent systemen ondersteunt. Voor zover wij weten, is dit de eerste systematische toepassing van een op tabulaire data gespecialiseerd LLM voor multimodale, op biomarkers gebaseerde AD-voorspelling. Het demonstreert dat dergelijke voorgetrainde modellen gestructureerde klinische voorspellings taken effectief kunnen aanpakken en legt de basis voor tabulaire LLM-gedreven multi-agent klinische beslissingsondersteunende systemen. De broncode is openbaar beschikbaar op GitHub: https://github.com/sophie-kearney/TAP-GPT.

English

Accurate diagnosis of Alzheimer's disease (AD) requires handling tabular biomarker data, yet such data are often small and incomplete, where deep learning models frequently fail to outperform classical methods. Pretrained large language models (LLMs) offer few-shot generalization, structured reasoning, and interpretable outputs, providing a powerful paradigm shift for clinical prediction. We propose TAP-GPT Tabular Alzheimer's Prediction GPT, a domain-adapted tabular LLM framework built on TableGPT2 and fine-tuned for few-shot AD classification using tabular prompts rather than plain texts. We evaluate TAP-GPT across four ADNI-derived datasets, including QT-PAD biomarkers and region-level structural MRI, amyloid PET, and tau PET for binary AD classification. Across multimodal and unimodal settings, TAP-GPT improves upon its backbone models and outperforms traditional machine learning baselines in the few-shot setting while remaining competitive with state-of-the-art general-purpose LLMs. We show that feature selection mitigates degradation in high-dimensional inputs and that TAP-GPT maintains stable performance under simulated and real-world missingness without imputation. Additionally, TAP-GPT produces structured, modality-aware reasoning aligned with established AD biology and shows greater stability under self-reflection, supporting its use in iterative multi-agent systems. To our knowledge, this is the first systematic application of a tabular-specialized LLM to multimodal biomarker-based AD prediction, demonstrating that such pretrained models can effectively address structured clinical prediction tasks and laying the foundation for tabular LLM-driven multi-agent clinical decision-support systems. The source code is publicly available on GitHub: https://github.com/sophie-kearney/TAP-GPT.

Tabellarische LLM's voor interpreteerbare voorspelling van de ziekte van Alzheimer met weinig voorbeelden met multimodale biomedische gegevens

Tabular LLMs for Interpretable Few-Shot Alzheimer's Disease Prediction with Multimodal Biomedical Data

Samenvatting

Support