ChatPaper.aiChatPaper

Взгляд сквозь мозг: реконструкция визуального восприятия на основе сигналов человеческого мозга

Seeing through the Brain: Image Reconstruction of Visual Perception from Human Brain Signals

July 27, 2023
Авторы: Yu-Ting Lan, Kan Ren, Yansen Wang, Wei-Long Zheng, Dongsheng Li, Bao-Liang Lu, Lili Qiu
cs.AI

Аннотация

Видеть — значит верить, однако механизм, лежащий в основе того, как человеческое визуальное восприятие связано с нашим познанием, до сих пор остается загадкой. Благодаря недавним достижениям в нейронауках и искусственном интеллекте, мы получили возможность записывать визуально вызванную активность мозга и имитировать способность визуального восприятия с помощью вычислительных подходов. В данной статье мы сосредоточимся на реконструкции визуальных стимулов, восстанавливая наблюдаемые изображения на основе портативно доступных сигналов мозга, а именно данных электроэнцефалографии (ЭЭГ). Поскольку сигналы ЭЭГ имеют динамический формат временных рядов и известны своей зашумленностью, обработка и извлечение полезной информации требуют более тщательных усилий. В этой статье мы предлагаем комплексный подход, названный NeuroImagen, для реконструкции изображений визуальных стимулов из сигналов ЭЭГ. В частности, мы используем новую методику декодирования многоуровневой перцептивной информации для получения многослойных выходных данных из предоставленных сигналов ЭЭГ. Затем латентная диффузионная модель использует извлеченную информацию для реконструкции высококачественных изображений визуальных стимулов. Экспериментальные результаты демонстрируют эффективность реконструкции изображений и превосходные количественные показатели предложенного метода.
English
Seeing is believing, however, the underlying mechanism of how human visual perceptions are intertwined with our cognitions is still a mystery. Thanks to the recent advances in both neuroscience and artificial intelligence, we have been able to record the visually evoked brain activities and mimic the visual perception ability through computational approaches. In this paper, we pay attention to visual stimuli reconstruction by reconstructing the observed images based on portably accessible brain signals, i.e., electroencephalography (EEG) data. Since EEG signals are dynamic in the time-series format and are notorious to be noisy, processing and extracting useful information requires more dedicated efforts; In this paper, we propose a comprehensive pipeline, named NeuroImagen, for reconstructing visual stimuli images from EEG signals. Specifically, we incorporate a novel multi-level perceptual information decoding to draw multi-grained outputs from the given EEG data. A latent diffusion model will then leverage the extracted information to reconstruct the high-resolution visual stimuli images. The experimental results have illustrated the effectiveness of image reconstruction and superior quantitative performance of our proposed method.
PDF223December 15, 2024