Ver a través del cerebro: Reconstrucción de imágenes de la percepción visual a partir de señales cerebrales humanas
Seeing through the Brain: Image Reconstruction of Visual Perception from Human Brain Signals
July 27, 2023
Autores: Yu-Ting Lan, Kan Ren, Yansen Wang, Wei-Long Zheng, Dongsheng Li, Bao-Liang Lu, Lili Qiu
cs.AI
Resumen
Ver es creer, sin embargo, el mecanismo subyacente de cómo las percepciones visuales humanas están entrelazadas con nuestras cogniciones sigue siendo un misterio. Gracias a los recientes avances tanto en neurociencia como en inteligencia artificial, hemos podido registrar las actividades cerebrales evocadas visualmente y emular la capacidad de percepción visual mediante enfoques computacionales. En este artículo, nos centramos en la reconstrucción de estímulos visuales mediante la reconstrucción de las imágenes observadas basándonos en señales cerebrales accesibles de manera portátil, es decir, datos de electroencefalografía (EEG). Dado que las señales EEG son dinámicas en formato de series temporales y son notoriamente ruidosas, procesar y extraer información útil requiere esfuerzos más dedicados. En este artículo, proponemos una pipeline integral, denominada NeuroImagen, para reconstruir imágenes de estímulos visuales a partir de señales EEG. Específicamente, incorporamos una novedosa decodificación de información perceptual multinivel para obtener salidas de múltiples granularidades a partir de los datos EEG proporcionados. Un modelo de difusión latente aprovechará entonces la información extraída para reconstruir las imágenes de estímulos visuales de alta resolución. Los resultados experimentales han demostrado la efectividad de la reconstrucción de imágenes y el rendimiento cuantitativo superior de nuestro método propuesto.
English
Seeing is believing, however, the underlying mechanism of how human visual
perceptions are intertwined with our cognitions is still a mystery. Thanks to
the recent advances in both neuroscience and artificial intelligence, we have
been able to record the visually evoked brain activities and mimic the visual
perception ability through computational approaches. In this paper, we pay
attention to visual stimuli reconstruction by reconstructing the observed
images based on portably accessible brain signals, i.e., electroencephalography
(EEG) data. Since EEG signals are dynamic in the time-series format and are
notorious to be noisy, processing and extracting useful information requires
more dedicated efforts; In this paper, we propose a comprehensive pipeline,
named NeuroImagen, for reconstructing visual stimuli images from EEG signals.
Specifically, we incorporate a novel multi-level perceptual information
decoding to draw multi-grained outputs from the given EEG data. A latent
diffusion model will then leverage the extracted information to reconstruct the
high-resolution visual stimuli images. The experimental results have
illustrated the effectiveness of image reconstruction and superior quantitative
performance of our proposed method.