ChatPaper.aiChatPaper

SoundCam: 室内音響を用いた人間検出のためのデータセット

SoundCam: A Dataset for Finding Humans Using Room Acoustics

November 6, 2023
著者: Mason Wang, Samuel Clarke, Jui-Hsien Wang, Ruohan Gao, Jiajun Wu
cs.AI

要旨

部屋の音響特性は、その部屋の幾何学的形状、部屋内の物体、およびそれらの特定の位置によって決定されます。部屋の音響特性は、音源とリスナーの位置間のインパルス応答(RIR)によって特徴づけられるか、あるいは部屋内に存在する自然な信号の録音から大まかに推測することができます。部屋内の物体の位置の変化は、RIRによって特徴づけられるように、部屋の音響特性に測定可能な変化をもたらすことがあります。既存のRIRデータセットは、環境内の物体の位置を体系的に変化させていないか、またはシミュレーションされたRIRのみで構成されています。本論文では、これまでに公開された中で最大の「実世界の部屋」からのユニークなRIRデータセットであるSoundCamを紹介します。これには、制御された音響実験室、実世界のリビングルーム、および会議室という3つの異なる部屋において、それぞれの部屋に配置された異なる人間を含む、5,000件の10チャンネルの実世界の部屋インパルス応答の測定と、2,000件の10チャンネルの音楽録音が含まれています。これらの測定が、人間の検出や識別、およびその位置の追跡といった興味深いタスクに利用できることを示します。
English
A room's acoustic properties are a product of the room's geometry, the objects within the room, and their specific positions. A room's acoustic properties can be characterized by its impulse response (RIR) between a source and listener location, or roughly inferred from recordings of natural signals present in the room. Variations in the positions of objects in a room can effect measurable changes in the room's acoustic properties, as characterized by the RIR. Existing datasets of RIRs either do not systematically vary positions of objects in an environment, or they consist of only simulated RIRs. We present SoundCam, the largest dataset of unique RIRs from in-the-wild rooms publicly released to date. It includes 5,000 10-channel real-world measurements of room impulse responses and 2,000 10-channel recordings of music in three different rooms, including a controlled acoustic lab, an in-the-wild living room, and a conference room, with different humans in positions throughout each room. We show that these measurements can be used for interesting tasks, such as detecting and identifying humans, and tracking their positions.
PDF140December 15, 2024