Tadabur: Ein umfangreicher Audio-Datensatz des Korans

Zusammenfassung

Trotz des wachsenden Interesses an der Erforschung von Korandaten sind bestehende Koran-Datensätze sowohl in ihrem Umfang als auch in ihrer Vielfalt begrenzt. Um diese Lücke zu schließen, stellen wir Tadabur vor, einen umfangreichen Audio-Datensatz des Korans. Tadabur umfasst mehr als 1400+ Stunden Rezitationsaudio von über 600 verschiedenen Rezitatoren und bietet erhebliche Variationen in Rezitationsstilen, Stimmmerkmalen und Aufnahmebedingungen. Diese Vielfalt macht Tadabur zu einer umfassenden und repräsentativen Ressource für die Erforschung und Analyse koranischer Sprache. Indem Tadabur sowohl die Gesamtdauer als auch die Variabilität der verfügbaren Korandaten erheblich erweitert, zielt es darauf ab, zukünftige Forschung zu unterstützen und die Entwicklung standardisierter Benchmarks für koranische Sprache zu erleichtern.

English

Despite growing interest in Quranic data research, existing Quran datasets remain limited in both scale and diversity. To address this gap, we present Tadabur, a large-scale Quran audio dataset. Tadabur comprises more than 1400+ hours of recitation audio from over 600 distinct reciters, providing substantial variation in recitation styles, vocal characteristics, and recording conditions. This diversity makes Tadabur a comprehensive and representative resource for Quranic speech research and analysis. By significantly expanding both the total duration and variability of available Quran data, Tadabur aims to support future research and facilitate the development of standardized Quranic speech benchmarks.

Tadabur: Ein umfangreicher Audio-Datensatz des Korans

Tadabur: A Large-Scale Quran Audio Dataset

Zusammenfassung

Support