ChatPaper.aiChatPaper

Vedere attraverso il cervello: Ricostruzione delle immagini della percezione visiva dai segnali cerebrali umani

Seeing through the Brain: Image Reconstruction of Visual Perception from Human Brain Signals

July 27, 2023
Autori: Yu-Ting Lan, Kan Ren, Yansen Wang, Wei-Long Zheng, Dongsheng Li, Bao-Liang Lu, Lili Qiu
cs.AI

Abstract

Vedere è credere, tuttavia, il meccanismo sottostante di come le percezioni visive umane siano intrecciate con le nostre cognizioni rimane ancora un mistero. Grazie ai recenti progressi sia nelle neuroscienze che nell'intelligenza artificiale, siamo stati in grado di registrare le attività cerebrali evocate visivamente e di imitare la capacità di percezione visiva attraverso approcci computazionali. In questo articolo, ci concentriamo sulla ricostruzione degli stimoli visivi ricostruendo le immagini osservate basandoci su segnali cerebrali accessibili in modo portatile, ovvero i dati dell'elettroencefalografia (EEG). Poiché i segnali EEG sono dinamici in formato di serie temporali e sono notoriamente rumorosi, elaborare ed estrarre informazioni utili richiede uno sforzo più dedicato; in questo articolo, proponiamo una pipeline completa, denominata NeuroImagen, per ricostruire immagini di stimoli visivi a partire dai segnali EEG. Nello specifico, incorporiamo una decodifica innovativa delle informazioni percettive multi-livello per ottenere output multi-granulari dai dati EEG forniti. Un modello di diffusione latente sfrutterà quindi le informazioni estratte per ricostruire immagini di stimoli visivi ad alta risoluzione. I risultati sperimentali hanno dimostrato l'efficacia della ricostruzione delle immagini e la superiore performance quantitativa del metodo da noi proposto.
English
Seeing is believing, however, the underlying mechanism of how human visual perceptions are intertwined with our cognitions is still a mystery. Thanks to the recent advances in both neuroscience and artificial intelligence, we have been able to record the visually evoked brain activities and mimic the visual perception ability through computational approaches. In this paper, we pay attention to visual stimuli reconstruction by reconstructing the observed images based on portably accessible brain signals, i.e., electroencephalography (EEG) data. Since EEG signals are dynamic in the time-series format and are notorious to be noisy, processing and extracting useful information requires more dedicated efforts; In this paper, we propose a comprehensive pipeline, named NeuroImagen, for reconstructing visual stimuli images from EEG signals. Specifically, we incorporate a novel multi-level perceptual information decoding to draw multi-grained outputs from the given EEG data. A latent diffusion model will then leverage the extracted information to reconstruct the high-resolution visual stimuli images. The experimental results have illustrated the effectiveness of image reconstruction and superior quantitative performance of our proposed method.
PDF223February 8, 2026