Взгляд сквозь мозг: реконструкция визуального восприятия на основе сигналов человеческого мозга
Seeing through the Brain: Image Reconstruction of Visual Perception from Human Brain Signals
July 27, 2023
Авторы: Yu-Ting Lan, Kan Ren, Yansen Wang, Wei-Long Zheng, Dongsheng Li, Bao-Liang Lu, Lili Qiu
cs.AI
Аннотация
Видеть — значит верить, однако механизм, лежащий в основе того, как человеческое визуальное восприятие связано с нашим познанием, до сих пор остается загадкой. Благодаря недавним достижениям в нейронауках и искусственном интеллекте, мы получили возможность записывать визуально вызванную активность мозга и имитировать способность визуального восприятия с помощью вычислительных подходов. В данной статье мы сосредоточимся на реконструкции визуальных стимулов, восстанавливая наблюдаемые изображения на основе портативно доступных сигналов мозга, а именно данных электроэнцефалографии (ЭЭГ). Поскольку сигналы ЭЭГ имеют динамический формат временных рядов и известны своей зашумленностью, обработка и извлечение полезной информации требуют более тщательных усилий. В этой статье мы предлагаем комплексный подход, названный NeuroImagen, для реконструкции изображений визуальных стимулов из сигналов ЭЭГ. В частности, мы используем новую методику декодирования многоуровневой перцептивной информации для получения многослойных выходных данных из предоставленных сигналов ЭЭГ. Затем латентная диффузионная модель использует извлеченную информацию для реконструкции высококачественных изображений визуальных стимулов. Экспериментальные результаты демонстрируют эффективность реконструкции изображений и превосходные количественные показатели предложенного метода.
English
Seeing is believing, however, the underlying mechanism of how human visual
perceptions are intertwined with our cognitions is still a mystery. Thanks to
the recent advances in both neuroscience and artificial intelligence, we have
been able to record the visually evoked brain activities and mimic the visual
perception ability through computational approaches. In this paper, we pay
attention to visual stimuli reconstruction by reconstructing the observed
images based on portably accessible brain signals, i.e., electroencephalography
(EEG) data. Since EEG signals are dynamic in the time-series format and are
notorious to be noisy, processing and extracting useful information requires
more dedicated efforts; In this paper, we propose a comprehensive pipeline,
named NeuroImagen, for reconstructing visual stimuli images from EEG signals.
Specifically, we incorporate a novel multi-level perceptual information
decoding to draw multi-grained outputs from the given EEG data. A latent
diffusion model will then leverage the extracted information to reconstruct the
high-resolution visual stimuli images. The experimental results have
illustrated the effectiveness of image reconstruction and superior quantitative
performance of our proposed method.