ChatPaper.aiChatPaper

Tadabur : Un vaste ensemble de données audio du Coran

Tadabur: A Large-Scale Quran Audio Dataset

April 21, 2026
Auteurs: Faisal Alherran
cs.AI

Résumé

Malgré l'intérêt croissant pour la recherche sur les données coraniques, les ensembles de données existants restent limités en termes d'échelle et de diversité. Pour combler cette lacune, nous présentons Tadabur, un vaste ensemble de données audio du Coran. Tadabur comprend plus de 1400 heures d'audio de récitation provenant de plus de 600 récitateurs distincts, offrant une variation substantielle des styles de récitation, des caractéristiques vocales et des conditions d'enregistrement. Cette diversité fait de Tadabur une ressource exhaustive et représentative pour la recherche et l'analyse de la parole coranique. En élargissant considérablement à la fois la durée totale et la variabilité des données coraniques disponibles, Tadabur vise à soutenir la recherche future et à faciliter le développement de référentiels standardisés pour la parole coranique.
English
Despite growing interest in Quranic data research, existing Quran datasets remain limited in both scale and diversity. To address this gap, we present Tadabur, a large-scale Quran audio dataset. Tadabur comprises more than 1400+ hours of recitation audio from over 600 distinct reciters, providing substantial variation in recitation styles, vocal characteristics, and recording conditions. This diversity makes Tadabur a comprehensive and representative resource for Quranic speech research and analysis. By significantly expanding both the total duration and variability of available Quran data, Tadabur aims to support future research and facilitate the development of standardized Quranic speech benchmarks.
PDF41April 24, 2026