ChatPaper.aiChatPaper

BeepBank-500: UIサウンド研究および心理音響研究のための合成イアコン・ミニコーパス

BeepBank-500: A Synthetic Earcon Mini-Corpus for UI Sound Research and Psychoacoustics Research

September 21, 2025
著者: Mandip Goswami
cs.AI

要旨

BeepBank-500を紹介します。これは、人間とコンピュータのインタラクションおよび音声機械学習における迅速で権利クリーンな実験を目的として設計された、コンパクトで完全に合成されたイアコン/アラートデータセット(300~500クリップ)です。各クリップは、波形ファミリー(正弦波、矩形波、三角波、FM)、基本周波数、持続時間、振幅エンベロープ、振幅変調(AM)、および軽量なシュレーダー式リバーブを制御するパラメトリックレシピから生成されています。リバーブ設定は3種類使用しています:ドライ、および「rir small」(「small」)と「rir medium」(「medium」)と表記される2つの合成ルームです。これらは論文全体およびメタデータで使用されています。モノラル48 kHz WAVオーディオ(16ビット)、豊富なメタデータテーブル(信号/スペクトル特徴)、および(i)波形ファミリー分類と(ii)単一トーンに対するf0回帰のための小さな再現可能なベースラインを公開しています。このコーパスは、イアコン分類、音色分析、オンセット検出などのタスクを対象としており、ライセンスと制限事項が明確に記載されています。オーディオはCC0-1.0を通じてパブリックドメインに専用されています;コードはMITライセンスです。データDOI: https://doi.org/10.5281/zenodo.17172015。コード: https://github.com/mandip42/earcons-mini-500。
English
We introduce BeepBank-500, a compact, fully synthetic earcon/alert dataset (300-500 clips) designed for rapid, rights-clean experimentation in human-computer interaction and audio machine learning. Each clip is generated from a parametric recipe controlling waveform family (sine, square, triangle, FM), fundamental frequency, duration, amplitude envelope, amplitude modulation (AM), and lightweight Schroeder-style reverberation. We use three reverberation settings: dry, and two synthetic rooms denoted 'rir small' ('small') and 'rir medium' ('medium') throughout the paper and in the metadata. We release mono 48 kHz WAV audio (16-bit), a rich metadata table (signal/spectral features), and tiny reproducible baselines for (i) waveform-family classification and (ii) f0 regression on single tones. The corpus targets tasks such as earcon classification, timbre analyses, and onset detection, with clearly stated licensing and limitations. Audio is dedicated to the public domain via CC0-1.0; code is under MIT. Data DOI: https://doi.org/10.5281/zenodo.17172015. Code: https://github.com/mandip42/earcons-mini-500.
PDF12September 23, 2025