Tadabur: Een grootschalige audiodataset van de Koran

Samenvatting

Ondanks de groeiende belangstelling voor onderzoek naar Korangegevens, blijven bestaande Korandatasets beperkt in zowel omvang als diversiteit. Om deze leemte op te vullen, presenteren wij Tadabur, een grootschalige Koran-audiodataset. Tadabur omvat meer dan 1400 uur aan recitatie-audio van meer dan 600 verschillende recitatoren, wat een aanzienlijke variatie biedt in recitatiestijlen, vocale kenmerken en opnameomstandigheden. Deze diversiteit maakt Tadabur tot een uitgebreide en representatieve bron voor onderzoek naar en analyse van Koranspraak. Door zowel de totale duur als de variabiliteit van beschikbare Korangegevens aanzienlijk uit te breiden, beoogt Tadabur toekomstig onderzoek te ondersteunen en de ontwikkeling van gestandaardiseerde Koranspraakbenchmarks te vergemakkelijken.

English

Despite growing interest in Quranic data research, existing Quran datasets remain limited in both scale and diversity. To address this gap, we present Tadabur, a large-scale Quran audio dataset. Tadabur comprises more than 1400+ hours of recitation audio from over 600 distinct reciters, providing substantial variation in recitation styles, vocal characteristics, and recording conditions. This diversity makes Tadabur a comprehensive and representative resource for Quranic speech research and analysis. By significantly expanding both the total duration and variability of available Quran data, Tadabur aims to support future research and facilitate the development of standardized Quranic speech benchmarks.

Tadabur: Een grootschalige audiodataset van de Koran

Tadabur: A Large-Scale Quran Audio Dataset

Samenvatting

Support