ChatPaper.aiChatPaper

BeepBank-500: Ein synthetisches Earcon-Mini-Korpus für die Forschung zu Benutzeroberflächenklängen und psychoakustische Studien

BeepBank-500: A Synthetic Earcon Mini-Corpus for UI Sound Research and Psychoacoustics Research

September 21, 2025
papers.authors: Mandip Goswami
cs.AI

papers.abstract

Wir stellen BeepBank-500 vor, einen kompakten, vollständig synthetischen Earcon/Alert-Datensatz (300-500 Clips), der für schnelle, rechtlich unbedenkliche Experimente in der Mensch-Computer-Interaktion und im Audio-Machine-Learning entwickelt wurde. Jeder Clip wird aus einem parametrischen Rezept generiert, das die Wellenformfamilie (Sinus, Rechteck, Dreieck, FM), die Grundfrequenz, die Dauer, die Hüllkurve, die Amplitudenmodulation (AM) und eine leichte Schroeder-artige Nachhallsteuerung bestimmt. Wir verwenden drei Nachhall-Einstellungen: trocken sowie zwei synthetische Räume, die im gesamten Papier und in den Metadaten als 'rir small' ('klein') und 'rir medium' ('mittel') bezeichnet werden. Wir veröffentlichen Mono-48-kHz-WAV-Audio (16-Bit), eine umfangreiche Metadatentabelle (Signal-/Spektraleigenschaften) und reproduzierbare Baselines für (i) die Klassifizierung von Wellenformfamilien und (ii) die F0-Regression bei einzelnen Tönen. Das Korpus zielt auf Aufgaben wie Earcon-Klassifizierung, Timbre-Analysen und Onset-Erkennung ab, mit klar festgelegten Lizenzbedingungen und Einschränkungen. Die Audiodaten sind über CC0-1.0 der öffentlichen Domain gewidmet; der Code steht unter der MIT-Lizenz. Daten-DOI: https://doi.org/10.5281/zenodo.17172015. Code: https://github.com/mandip42/earcons-mini-500.
English
We introduce BeepBank-500, a compact, fully synthetic earcon/alert dataset (300-500 clips) designed for rapid, rights-clean experimentation in human-computer interaction and audio machine learning. Each clip is generated from a parametric recipe controlling waveform family (sine, square, triangle, FM), fundamental frequency, duration, amplitude envelope, amplitude modulation (AM), and lightweight Schroeder-style reverberation. We use three reverberation settings: dry, and two synthetic rooms denoted 'rir small' ('small') and 'rir medium' ('medium') throughout the paper and in the metadata. We release mono 48 kHz WAV audio (16-bit), a rich metadata table (signal/spectral features), and tiny reproducible baselines for (i) waveform-family classification and (ii) f0 regression on single tones. The corpus targets tasks such as earcon classification, timbre analyses, and onset detection, with clearly stated licensing and limitations. Audio is dedicated to the public domain via CC0-1.0; code is under MIT. Data DOI: https://doi.org/10.5281/zenodo.17172015. Code: https://github.com/mandip42/earcons-mini-500.
PDF12September 23, 2025