WaveDiT: Distributiebewuste Wavelet-Flow Matching voor Efficiënte 3D-hersen-MRI-synthese
WaveDiT: Distribution-Aware Wavelet Flow Matching for Efficient 3D Brain MRI Synthesis
June 7, 2026
Auteurs: Danilo Danese, Angela Lombardi, Giuseppe Fasano, Matteo Attimonelli, Tommaso Di Noia
cs.AI
Samenvatting
Grote en demografisch gebalanceerde datasets zijn essentieel voor betrouwbare neuroimaging-biomarkers. Synthese van 3D-hersen-MRI op volledige resolutie kan data-augmentatie in deze context ondersteunen, maar bestaande benaderingen brengen ofwel prohibitieve rekenkosten met zich mee op volumetrische schaal, ofwel vertrouwen op lossy latente compressie die ten koste kan gaan van anatomische details. Hierdoor vereist praktische 3D-generatieve augmentatie vaak gespecialiseerde rekeninfrastructuur. Wij stellen WaveDiT voor, een raamwerk voor conditionele stromingsmatching dat opereert in de coëfficiëntenruimte van een 3D-Haar-discrete wavelettransformatie. Het model combineert gefactoriseerde spatio-diepte-attentie met bandgewijze heteroscedastische onzekerheidsmodellering, afgeleid van hogere-orde waveletstatistieken. Voorspelde log-variantie wordt direct geïntegreerd in zowel de stromingsdoelstelling als het conditioneringspad, wat adaptieve precisie mogelijk maakt die consistent is met de zware-staart- en ingangsafhankelijke variantiestructuur van anatomische details. Deze formulering ondersteunt synthese van volledige 3D-resolutie onder praktische geheugen- en tijdsbeperkingen op een enkele moderne GPU. Evaluatie op een multi-site-cohort toont een betere afstemming tussen gegenereerde en echte MRI-verdelingen aan, samen met verbeterde stroomafwaartse hersenleeftijdvoorspelling en regionale anatomische overeenstemming in vergelijking met diffusie-, latente en waveletgebaseerde basismethoden. Code is beschikbaar op https://github.com/sisinflab/WaveDiT
English
Large and demographically balanced datasets are essential for reliable neuroimaging biomarkers. Full-resolution 3D brain MRI synthesis can support data augmentation in this setting, but existing approaches either incur prohibitive computational cost at volumetric scale or rely on lossy latent compression that may compromise anatomical detail. As a result, practical 3D generative augmentation often requires specialized compute infrastructure. We propose WaveDiT, a conditional flow matching framework operating in the coefficient space of a 3D Haar Discrete Wavelet Transform. The model combines factorized spatio-depth attention with band-wise heteroscedastic uncertainty modeling derived from higher-order wavelet statistics. Predicted log-variance is integrated directly into both the flow objective and conditioning pathway, enabling adaptive precision consistent with the heavy-tailed and input-dependent variance structure of anatomical detail. This formulation supports full-resolution 3D synthesis under practical memory and time constraints on a single modern GPU. Evaluation on a multi-site cohort demonstrates improved alignment between generated and real MRI distributions, together with enhanced downstream brain age prediction and region-level anatomical agreement relative to diffusion, latent, and wavelet-based baselines. Code is available at https://github.com/sisinflab/WaveDiT