Табличные большие языковые модели для интерпретируемого прогнозирования болезни Альцгеймера с немногими примерами на основе мультимодальных биомедицинских данных

Аннотация

Точная диагностика болезни Альцгеймера (БА) требует обработки табличных данных биомаркеров, однако такие данные часто являются малочисленными и неполными, в связи с чем глубокие нейронные сети зачастую не превосходят классические методы. Предобученные большие языковые модели (LLM) обладают свойствами few-shot обобщения, структурированных рассуждений и интерпретируемости выходных данных, что представляет собой мощный парадигмальный сдвиг в области клинического прогнозирования. Мы предлагаем TAP-GPT (Tabular Alzheimer's Prediction GPT) — предметно-адаптированную табличную LLM-архитектуру, построенную на основе TableGPT2 и дообученную для few-shot классификации БА с использованием табличных промптов вместо обычного текста. Мы оцениваем TAP-GPT на четырех наборах данных, полученных из ADNI, включая биомаркеры QT-PAD, а также региональные структурные МРТ, ПЭТ-амилоид и ПЭТ-тау для бинарной классификации БА. В условиях как многомодальных, так и одномодальных настроек TAP-GPT превосходит свои базовые модели и опережает традиционные методы машинного обучения в условиях few-shot, оставаясь при этом конкурентоспособной по сравнению с современными универсальными LLM. Мы показываем, что отбор признаков смягчает деградацию при работе с высокоразмерными входными данными и что TAP-GPT сохраняет стабильную производительность при имитированной и реальной неполноте данных без импутации. Кроме того, TAP-GPT генерирует структурированные, учитывающие модальность рассуждения, согласованные с установленной биологией БА, и демонстрирует повышенную стабильность при самокоррекции, что поддерживает её использование в итеративных мульти-агентных системах. Насколько нам известно, это первое систематическое применение специализированной для табличных данных LLM для многомодального прогнозирования БА на основе биомаркеров, демонстрирующее, что такие предобученные модели могут эффективно решать структурированные клинические прогностические задачи и закладывающее основу для мульти-агентных систем клинической поддержки принятия решений на основе табличных LLM. Исходный код общедоступен на GitHub: https://github.com/sophie-kearney/TAP-GPT.

English

Accurate diagnosis of Alzheimer's disease (AD) requires handling tabular biomarker data, yet such data are often small and incomplete, where deep learning models frequently fail to outperform classical methods. Pretrained large language models (LLMs) offer few-shot generalization, structured reasoning, and interpretable outputs, providing a powerful paradigm shift for clinical prediction. We propose TAP-GPT Tabular Alzheimer's Prediction GPT, a domain-adapted tabular LLM framework built on TableGPT2 and fine-tuned for few-shot AD classification using tabular prompts rather than plain texts. We evaluate TAP-GPT across four ADNI-derived datasets, including QT-PAD biomarkers and region-level structural MRI, amyloid PET, and tau PET for binary AD classification. Across multimodal and unimodal settings, TAP-GPT improves upon its backbone models and outperforms traditional machine learning baselines in the few-shot setting while remaining competitive with state-of-the-art general-purpose LLMs. We show that feature selection mitigates degradation in high-dimensional inputs and that TAP-GPT maintains stable performance under simulated and real-world missingness without imputation. Additionally, TAP-GPT produces structured, modality-aware reasoning aligned with established AD biology and shows greater stability under self-reflection, supporting its use in iterative multi-agent systems. To our knowledge, this is the first systematic application of a tabular-specialized LLM to multimodal biomarker-based AD prediction, demonstrating that such pretrained models can effectively address structured clinical prediction tasks and laying the foundation for tabular LLM-driven multi-agent clinical decision-support systems. The source code is publicly available on GitHub: https://github.com/sophie-kearney/TAP-GPT.

Tabular LLMs for Interpretable Few-Shot Alzheimer's Disease Prediction with Multimodal Biomedical Data

Аннотация

Support