ChatPaper.aiChatPaper

SoundCam: 실내 음향을 활용한 인간 탐지를 위한 데이터셋

SoundCam: A Dataset for Finding Humans Using Room Acoustics

November 6, 2023
저자: Mason Wang, Samuel Clarke, Jui-Hsien Wang, Ruohan Gao, Jiajun Wu
cs.AI

초록

방의 음향 특성은 방의 기하학적 구조, 방 내부의 물체, 그리고 그들의 구체적인 위치에 의해 결정됩니다. 방의 음향 특성은 소스와 청취자 위치 간의 임펄스 응답(RIR)으로 특징지어지거나, 방 내부의 자연 신호 녹음을 통해 대략적으로 추론될 수 있습니다. 방 내부 물체의 위치 변화는 RIR로 특징지어진 방의 음향 특성에 측정 가능한 변화를 일으킬 수 있습니다. 기존의 RIR 데이터셋은 환경 내 물체의 위치를 체계적으로 변화시키지 않거나, 시뮬레이션된 RIR만으로 구성되어 있습니다. 우리는 현재까지 공개된 것 중 가장 큰 실제 환경에서 측정된 고유한 RIR 데이터셋인 SoundCam을 소개합니다. 이 데이터셋은 세 가지 다른 방(통제된 음향 실험실, 실제 거실, 회의실)에서 측정된 10채널 실세계 임펄스 응답 5,000개와 10채널 음악 녹음 2,000개를 포함하며, 각 방 내부에 위치한 다양한 사람들을 포함합니다. 우리는 이러한 측정값이 사람을 감지하고 식별하며, 그들의 위치를 추적하는 것과 같은 흥미로운 작업에 사용될 수 있음을 보여줍니다.
English
A room's acoustic properties are a product of the room's geometry, the objects within the room, and their specific positions. A room's acoustic properties can be characterized by its impulse response (RIR) between a source and listener location, or roughly inferred from recordings of natural signals present in the room. Variations in the positions of objects in a room can effect measurable changes in the room's acoustic properties, as characterized by the RIR. Existing datasets of RIRs either do not systematically vary positions of objects in an environment, or they consist of only simulated RIRs. We present SoundCam, the largest dataset of unique RIRs from in-the-wild rooms publicly released to date. It includes 5,000 10-channel real-world measurements of room impulse responses and 2,000 10-channel recordings of music in three different rooms, including a controlled acoustic lab, an in-the-wild living room, and a conference room, with different humans in positions throughout each room. We show that these measurements can be used for interesting tasks, such as detecting and identifying humans, and tracking their positions.
PDF140December 15, 2024