Ver Rostos em Coisas: Um Modelo e Conjunto de Dados para Pareidolia
Seeing Faces in Things: A Model and Dataset for Pareidolia
September 24, 2024
Autores: Mark Hamilton, Simon Stent, Vasha DuTell, Anne Harrington, Jennifer Corbett, Ruth Rosenholtz, William T. Freeman
cs.AI
Resumo
O sistema visual humano está bem ajustado para detectar rostos de todas as formas e tamanhos. Embora isso traga óbvias vantagens de sobrevivência, como uma melhor chance de avistar predadores desconhecidos na mata, também leva a detecções espúrias de rostos. "Pareidolia facial" descreve a percepção de uma estrutura semelhante a um rosto entre estímulos aleatórios: ver rostos em manchas de café ou nuvens no céu. Neste artigo, estudamos a pareidolia facial de uma perspectiva de visão computacional. Apresentamos um conjunto de dados de imagens de "Rostos em Coisas", composto por cinco mil imagens da web com rostos pareidólicos anotados por humanos. Usando este conjunto de dados, examinamos em que medida um detector de rostos humano de última geração exibe pareidolia e encontramos uma diferença comportamental significativa entre humanos e máquinas. Descobrimos que a necessidade evolutiva dos humanos de detectar rostos de animais, bem como rostos humanos, pode explicar parte dessa diferença. Por fim, propomos um modelo estatístico simples de pareidolia em imagens. Através de estudos em sujeitos humanos e em nossos detectores de rostos pareidólicos, confirmamos uma previsão-chave de nosso modelo sobre quais condições de imagem são mais propensas a induzir a pareidolia. Conjunto de Dados e Website: https://aka.ms/faces-in-things
English
The human visual system is well-tuned to detect faces of all shapes and
sizes. While this brings obvious survival advantages, such as a better chance
of spotting unknown predators in the bush, it also leads to spurious face
detections. ``Face pareidolia'' describes the perception of face-like structure
among otherwise random stimuli: seeing faces in coffee stains or clouds in the
sky. In this paper, we study face pareidolia from a computer vision
perspective. We present an image dataset of ``Faces in Things'', consisting of
five thousand web images with human-annotated pareidolic faces. Using this
dataset, we examine the extent to which a state-of-the-art human face detector
exhibits pareidolia, and find a significant behavioral gap between humans and
machines. We find that the evolutionary need for humans to detect animal faces,
as well as human faces, may explain some of this gap. Finally, we propose a
simple statistical model of pareidolia in images. Through studies on human
subjects and our pareidolic face detectors we confirm a key prediction of our
model regarding what image conditions are most likely to induce pareidolia.
Dataset and Website: https://aka.ms/faces-in-thingsSummary
AI-Generated Summary