Vedere attraverso il cervello: Ricostruzione delle immagini della percezione visiva dai segnali cerebrali umani
Seeing through the Brain: Image Reconstruction of Visual Perception from Human Brain Signals
July 27, 2023
Autori: Yu-Ting Lan, Kan Ren, Yansen Wang, Wei-Long Zheng, Dongsheng Li, Bao-Liang Lu, Lili Qiu
cs.AI
Abstract
Vedere è credere, tuttavia, il meccanismo sottostante di come le percezioni visive umane siano intrecciate con le nostre cognizioni rimane ancora un mistero. Grazie ai recenti progressi sia nelle neuroscienze che nell'intelligenza artificiale, siamo stati in grado di registrare le attività cerebrali evocate visivamente e di imitare la capacità di percezione visiva attraverso approcci computazionali. In questo articolo, ci concentriamo sulla ricostruzione degli stimoli visivi ricostruendo le immagini osservate basandoci su segnali cerebrali accessibili in modo portatile, ovvero i dati dell'elettroencefalografia (EEG). Poiché i segnali EEG sono dinamici in formato di serie temporali e sono notoriamente rumorosi, elaborare ed estrarre informazioni utili richiede uno sforzo più dedicato; in questo articolo, proponiamo una pipeline completa, denominata NeuroImagen, per ricostruire immagini di stimoli visivi a partire dai segnali EEG. Nello specifico, incorporiamo una decodifica innovativa delle informazioni percettive multi-livello per ottenere output multi-granulari dai dati EEG forniti. Un modello di diffusione latente sfrutterà quindi le informazioni estratte per ricostruire immagini di stimoli visivi ad alta risoluzione. I risultati sperimentali hanno dimostrato l'efficacia della ricostruzione delle immagini e la superiore performance quantitativa del metodo da noi proposto.
English
Seeing is believing, however, the underlying mechanism of how human visual
perceptions are intertwined with our cognitions is still a mystery. Thanks to
the recent advances in both neuroscience and artificial intelligence, we have
been able to record the visually evoked brain activities and mimic the visual
perception ability through computational approaches. In this paper, we pay
attention to visual stimuli reconstruction by reconstructing the observed
images based on portably accessible brain signals, i.e., electroencephalography
(EEG) data. Since EEG signals are dynamic in the time-series format and are
notorious to be noisy, processing and extracting useful information requires
more dedicated efforts; In this paper, we propose a comprehensive pipeline,
named NeuroImagen, for reconstructing visual stimuli images from EEG signals.
Specifically, we incorporate a novel multi-level perceptual information
decoding to draw multi-grained outputs from the given EEG data. A latent
diffusion model will then leverage the extracted information to reconstruct the
high-resolution visual stimuli images. The experimental results have
illustrated the effectiveness of image reconstruction and superior quantitative
performance of our proposed method.