ChatPaper.aiChatPaper

WaveDiT: Распределенно-осознанное согласование вейвлет-потоков для эффективного синтеза 3D МРТ головного мозга

WaveDiT: Distribution-Aware Wavelet Flow Matching for Efficient 3D Brain MRI Synthesis

June 7, 2026
Авторы: Danilo Danese, Angela Lombardi, Giuseppe Fasano, Matteo Attimonelli, Tommaso Di Noia
cs.AI

Аннотация

Большие и демографически сбалансированные наборы данных необходимы для надежных биомаркеров нейровизуализации. Синтез полномасштабных 3D МРТ-изображений головного мозга может поддерживать аугментацию данных в этом контексте, но существующие подходы либо требуют непомерных вычислительных затрат при объемном масштабировании, либо полагаются на сжатие с потерями в латентном пространстве, что может ухудшить анатомические детали. В результате практическая генеративная аугментация 3D-данных часто требует специализированной вычислительной инфраструктуры. Мы предлагаем WaveDiT — фреймворк условного согласования потоков, работающий в пространстве коэффициентов трехмерного дискретного вейвлет-преобразования Хаара. Модель сочетает факторизованное пространственно-глубинное внимание с гетероскедастическим моделированием неопределенности по полосам, основанным на статистиках вейвлетов высших порядков. Предсказанная лог-дисперсия интегрируется непосредственно как в целевую функцию потока, так и в путь обусловливания, обеспечивая адаптивную точность, согласующуюся с тяжелохвостой и зависящей от входных данных структурой дисперсии анатомических деталей. Такая формулировка поддерживает полномасштабный 3D-синтез при практических ограничениях по памяти и времени на одном современном GPU. Оценка на многоплощадочной когорте демонстрирует улучшенное выравнивание между сгенерированными и реальными распределениями МРТ, а также улучшенное последующее предсказание возраста мозга и региональное анатомическое согласие по сравнению с базовыми подходами на основе диффузии, латентных представлений и вейвлетов. Код доступен по адресу https://github.com/sisinflab/WaveDiT.
English
Large and demographically balanced datasets are essential for reliable neuroimaging biomarkers. Full-resolution 3D brain MRI synthesis can support data augmentation in this setting, but existing approaches either incur prohibitive computational cost at volumetric scale or rely on lossy latent compression that may compromise anatomical detail. As a result, practical 3D generative augmentation often requires specialized compute infrastructure. We propose WaveDiT, a conditional flow matching framework operating in the coefficient space of a 3D Haar Discrete Wavelet Transform. The model combines factorized spatio-depth attention with band-wise heteroscedastic uncertainty modeling derived from higher-order wavelet statistics. Predicted log-variance is integrated directly into both the flow objective and conditioning pathway, enabling adaptive precision consistent with the heavy-tailed and input-dependent variance structure of anatomical detail. This formulation supports full-resolution 3D synthesis under practical memory and time constraints on a single modern GPU. Evaluation on a multi-site cohort demonstrates improved alignment between generated and real MRI distributions, together with enhanced downstream brain age prediction and region-level anatomical agreement relative to diffusion, latent, and wavelet-based baselines. Code is available at https://github.com/sisinflab/WaveDiT