脳を通して見る:人間の脳信号からの視覚知覚の画像再構築
Seeing through the Brain: Image Reconstruction of Visual Perception from Human Brain Signals
July 27, 2023
著者: Yu-Ting Lan, Kan Ren, Yansen Wang, Wei-Long Zheng, Dongsheng Li, Bao-Liang Lu, Lili Qiu
cs.AI
要旨
百聞は一見に如かず、しかしながら、人間の視覚的知覚がどのように認知と絡み合っているのか、その根本的なメカニズムは依然として謎に包まれています。神経科学と人工知能の最近の進展のおかげで、視覚的に誘発された脳活動を記録し、計算論的アプローチを通じて視覚知覚能力を模倣することが可能になりました。本論文では、ポータブルにアクセス可能な脳信号、すなわち脳波(EEG)データに基づいて観察された画像を再構築することによる視覚刺激の再構成に注目します。EEG信号は時系列形式で動的であり、ノイズが多いことで知られているため、有用な情報を処理・抽出するためにはより専念した取り組みが必要です。本論文では、EEG信号から視覚刺激画像を再構築するための包括的なパイプライン「NeuroImagen」を提案します。具体的には、与えられたEEGデータから多粒度の出力を引き出すために、新たなマルチレベル知覚情報デコーディングを組み込みます。その後、潜在拡散モデルが抽出された情報を活用して高解像度の視覚刺激画像を再構築します。実験結果は、画像再構成の有効性と提案手法の優れた定量的性能を示しています。
English
Seeing is believing, however, the underlying mechanism of how human visual
perceptions are intertwined with our cognitions is still a mystery. Thanks to
the recent advances in both neuroscience and artificial intelligence, we have
been able to record the visually evoked brain activities and mimic the visual
perception ability through computational approaches. In this paper, we pay
attention to visual stimuli reconstruction by reconstructing the observed
images based on portably accessible brain signals, i.e., electroencephalography
(EEG) data. Since EEG signals are dynamic in the time-series format and are
notorious to be noisy, processing and extracting useful information requires
more dedicated efforts; In this paper, we propose a comprehensive pipeline,
named NeuroImagen, for reconstructing visual stimuli images from EEG signals.
Specifically, we incorporate a novel multi-level perceptual information
decoding to draw multi-grained outputs from the given EEG data. A latent
diffusion model will then leverage the extracted information to reconstruct the
high-resolution visual stimuli images. The experimental results have
illustrated the effectiveness of image reconstruction and superior quantitative
performance of our proposed method.